13.3.1 HTMLParser オブジェクト

タグメソッドに加えて、HTMLParser クラスではタグメソッド で利用するためのいくつかのメソッドとインスタンス変数を提供しています。

formatter
パーザに関連付けられているフォーマッタインスタンスです。

nofill
ブール値のフラグで、空白文字を縮約したくないときには真、縮約するときには 偽にします。一般的には、この値を真にするのは、<PRE> 要素の 中のテキストのように、文字列データが ``書式化済みの (preformatted)'' 場合だけです。標準の値は偽です。この値は handle_data() および save_end() の操作に影響します。

anchor_bgn( href, name, type)
このメソッドはアンカー領域の先頭で呼び出されます。引数は <A> タグの属性で同じ名前を持つものに対応します。 標準の実装では、ドキュメント内のハイパーリンク (<A> タグの HREF 属性) を列挙したリスト を維持しています。ハイパーリンクのリストはデータ属性 anchorlist で手に入れることができます。

anchor_end( )
このメソッドはアンカー領域の末尾で呼び出されます。標準の 実装では、テキストの注釈マーカを追加します。マーカは anchor_bgn() で作られたハイパーリンクリストの インデクス値です。

handle_image( source, alt[, ismap[, align[, width[, height]]]])
このメソッドは画像を扱うために呼び出されます。標準の実装では、 単に handle_data()alt の値を渡すだけです。

save_bgn( )
文字列データをフォーマッタオブジェクトに送らずにバッファに保存 する操作を開始します。保存されたデータは save_end() で取得してください。 save_bgn() / save_end() のペアを入れ子構造にすることはできません。

save_end( )
文字列データのバッファリングを終了し、以前 save_bgn() を呼び出した時点から保存されている全てのデータを返します。 nofill フラグが偽の場合、空白文字は全てスペース文字 一文字に置き換えられます。予め save_bgn() を呼ばないで このメソッドを呼び出すと TypeError 例外が送出されます。

ご意見やご指摘をお寄せになりたい方は、 このドキュメントについて... をご覧ください。