組み込み関数とは、Pythonインタプリタに標準で組み込まれている関数です。
関数 | 機能 |
---|---|
bool | 値をブール値にキャスト |
chr | 与えられたコードのASCII文字を返す |
help | 組み込みヘルプシステムの起動 |
int | 整数への変換 |
len | オブジェクトの要素数を取得 |
open | ファイルをオープン |
オブジェクトを文字列に変換してストリームに出力 | |
str | オブジェクトを文字列に変換 |
unichr | 与えられた文字コードのUnicode文字を返す/td> |
unicode | オブジェクトを表現するunicode文字列を返す |
bool関数は与えられた値をブール値に変換して返します。ブール値への変換には標準の真偽テストが用いられます。
bool( [ val ] )
valにはブール値に変換する値を渡します。valが省略されるとbool関数はFalseを返します。
chr関数は与えられた文字コードのASCII文字を返します。
chr( code )
codeには文字コードを指定します。
help関数を使って組み込みヘルプシステムを起動することで、モジュールやオブジェクトなどのヘルプ情報を表示することができます。
help( [ object ] )
引数を省略すると現在のコンソール上でヘルプシステムが起動します。
Welcome to Python 2.6! This is the online help utility. If this is your first time using Python, you should definitely check out the tutorial on the Internet at http://docs.python.org/tutorial/. Enter the name of any module, keyword, or topic to get help on writing Python programs and using Python modules. To quit this help utility and return to the interpreter, just type "quit". To get a list of available modules, keywords, or topics, type "modules", "keywords", or "topics". Each module also comes with a one-line summary of what it does; to list the modules whose summaries contain a given word such as "spam", type "modules spam". help>
引数が文字列の場合、その文字列を使ってモジュール、関数、クラス、メソッド、キーワード、ドキュメント項目が検索され、該当するヘルプドキュメントがあればそれが表示されます。
help( 're' )
上記を実行するとreモジュールのヘルプが表示されます。
Help on module re: NAME re - Support for regular expressions (RE). FILE /usr/lib/python2.6/re.py MODULE DOCS http://docs.python.org/library/re DESCRIPTION This module provides regular expression matching operations similar to those found in Perl. It supports both 8-bit and Unicode strings; both the pattern and the strings being processed can contain null bytes and characters outside the US ASCII range. ..
引数がオブジェクトの場合、そのオブジェクトに関するヘルプが表示されます。
from BeautifulSoup import BeautifulSoup soup = BeautifulSoup("") help( soup )
上記はBeautifulSoupオブジェクトをhelp関数に渡しています。その結果、以下のようにBeautifulSoupのヘルプが表示されます。
Help on BeautifulSoup in module BeautifulSoup object: class BeautifulSoup(BeautifulStoneSoup) | This parser knows the following facts about HTML: | | * Some tags have no closing tag and should be interpreted as being | closed as soon as they are encountered.
int関数は文字列または数値を整数に変換します。
int( [ val [, radix ] ] )
valには文字列または数値を指定します。radixには変換に用いられる基数を指定します。2から36の範囲の値とゼロを指定することができます。ゼロを指定すると、入力valから基数が推測されます。Pythonのドキュメントの多くは、この関数について、「引数が文字列の場合、Python 整数として表現可能な10進数でなければならない」とありますが、釈然としません。たとえば、以下のコードは入力を16進文字列として与え、基数を16進数に指定することで正しく変換されます。
hexStr = "f" print "hexStr=", int( hexStr, 16 )
len関数はシーケンス型やマップ型のオブジェクトの要素数を返します。
len( object )
ファイルを開くにはopen関数を使います(fileのコンストラクタを呼ぶ方法は望ましい方法ではありません)。
open( filename[, mode [, bufsize ] ] )
filenameにはファイル名を指定します。modeの意味はCの標準関数fopenとほぼ同じ意味です。このオプションが省略されると'r'(読み出しモード)が指定されたとみなされます。
mode値 | 説明 |
---|---|
'r' | 読み出しモード |
'w' | 書き込みモード |
'a' | 追加モード |
'b' | バイナリモード |
'+' | 更新モード('r+', 'w+', 'a+') |
'U' | 改行モードの設定 |
'rU' | 改行モードの設定 |
bufsizeにはファイルのためのバッファサイズを指定します。
bufsize値 | 説明 |
---|---|
0 | バッファリングしない |
1 | 1行単位でバッファリング |
その他の正の値 | バッファサイズ(近似されます) |
print関数はストリームにオブジェクトを出力します。
print( [ object, ...][, sep=' '] [, end='\\n'] [, file=sys.stdout] )
objectには出力するオブジェクトを指定します。printは指定されたオブジェクトを文字列に変換して出力します。objectはカンマで区切って複数指定することもできます、この場合、それぞれの出力の間にはスペースが入ります。この区切り文字はsep引数で変更することができます。出力の最後には改行が入ります。この改行文字はend引数によって変更することができます。出力は標準出力に対して行われますが、file引数を使うことで別のファイルオブジェクトに出力することもできます。sep, end, file引数はキーワード付き引数です。printは組み込み関数ですが、デフォルトでは使えないようになっています。print関数を使うには、以下のインポートを行います(print関数を有効にすると、print文がprint関数とみなされてエラーになるようです)。
from __future__ import print_function使用例
from __future__ import print_function print('a', 'b', 'c', sep='/', end="[e}")
str関数は与えられたオブジェクトを印刷可能な文字列に変換して返します。オブジェクトは引数によってstr関数に渡されますが、この引数が省略された場合、空の文字列''を返します。
str( [ object ] )
unichr関数は与えられた文字コードのUnicode文字を返します。
unichar( code )
codeには文字コードを指定します。
unicode関数はオブジェクトの(を表現する?)Unicode文字列を返します。
unicode( [ object[, encoding [, errors ] ] ] )
objectはオブジェクトを指定するための引数です。encodingはエンコーディングを指定するための引数です(おそらくPythonの「標準エンコーディング」として定義されるエンコーディング名 ─ たとえば、ascii、utf-8など ─ を指定すれば良いと思います)。 errorsはエンコードの過程で無効な文字が発見された場合の振る舞いを指定するための引数です。'strict'、'ignore' 、'replace'のいずれかを指定することができます。'strict'が標準の設定となります。objectまたはencoding引数が渡された場合、オブジェクトはencodingで指定されたcodecでデコードされます。無効な文字が発見された場合の処理はerrors引数によって決まります。errorsが省略された場合、'strict'の設定が適用されます。
errors値 | 説明 |
---|---|
'strict' | ValueError が送出されます |
'ignore' | 無効な文字は無視されます |
'replace' | 無効な文字はU+FFFDに置き換えられます |
objectもencodingも省略された場合、unicode関数はstr関数と同じような働きをします。しかし、unicode関数の場合8ビット文字列ではなくUnicode文字列を返す点が異なります。