BeautifulSoupはHTMLやXMLの構文解析のためのPython用のモジュールです。このドキュメントではBeautifulSoup 4の以前の仕様にもとづいて書いています。
Beatifl Soupには、BeatiflSoupというオブジェクトがあります。このドキュメントで「Beatifl Soup」と書く場合はBeatifl Soupモジュール全体を意味し「BeatiflSoup」と書く場合はBeatiflSoupオブジェクトを意味します。
インストール
BeautifulSoupの機能のインポート
HTMLドキュメントの処理
ドキュメントの表示
パーサーオブジェクト
パースツリー
ツリーのナビゲート
parent
contents
string
nextSiblingとpreviousSibling
nextとprevious
タグの繰り返し処理
タグ名をメンバーとして使う
パースツリーの検索
ドキュメントの改ざん
BeautifulSoupとBeautifulStoneSoupのオブジェクト
BeautifulSoupオブジェクトの生成
オリジナルドキュメントの文字コードを調べる
ドキュメントの整形
コンテンツの出力
オブジェクトを文字列に変換
findAllメソッド(条件にマッチするすべてのTagオブジェクトとオブジェクトを検索)
nameを使った検索
関数を使った検索条件の指定
正規表現を使った検索条件の指定
キーワード引数を使った検索条件の指定
CSSクラスの検索
test(NavigableStringオブジェクトの検索)
recursive(再帰的な検索)
limit(マッチの上限を設定)
findメソッド(条件にマッチする最初のTagオブジェクトとNavigableStringオブジェクトを検索)
Tagオブジェクト
Tagの呼び出しとfindAllの呼び出しの類似性
日本語対応
BeautifulSoupプロジェクトのホームページ