忍者ブログ
     2008年11月14日 開始
[7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17]
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

utf-8文字列をunicodeに変換
   (unicode関数を使う )

# -*- coding: utf-8 -*-

name=unicode('utf-8 文字列')
------------------------------------

unicode( [object[, encoding [, errors]]])
以下のモードのうち一つを使って、object のUnicode 文字列バージョンを返します:

もし encoding かつ/または errors が与えられていれば、 unicode() は 8 ビットの文字列または文字列バッファになっているオブジェクトを encoding の codec を使ってデコードします。 encoding パラメタはエンコーディング名を与える文字列です; 未知のエンコーディングの場合、LookupError が送出されます。
 エラー処理は errors に従って行われます; このパラメタは入力エンコーディング中で無効な文字の扱い方を指定します。errors'strict' (標準の設定です) の場合、エラー発生時には ValueError が送出されます。一方、'ignore' では、エラーは暗黙のうちに無視されるようになり、'replace' では公式の置換文字、U+FFFD を使って、デコードできなかった文字を置き換えます。

codecs モジュールについても参照してください。

オプションのパラメタが与えられていない場合、 unicode()str() の動作をまねます。ただし、8 ビット文字列ではなく、 Unicode 文字列を返します。もっと詳しくいえば、 object が Unicode 文字列かそのサブクラスなら、デコード処理を一切介することなく Unicode 文字列を返すということです。

PR


忍者ブログ [PR]
お天気情報
カレンダー
03 2024/04 05
S M T W T F S
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
リンク
フリーエリア
最新CM
最新TB
プロフィール
HN:
No Name Ninja
性別:
非公開
バーコード
ブログ内検索
P R
カウンター
ブログの評価 ブログレーダー