忍者ブログ
     2008年11月14日 開始
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

utf-8文字列をunicodeに変換
   (unicode関数を使う )

# -*- coding: utf-8 -*-

name=unicode('utf-8 文字列')
------------------------------------

unicode( [object[, encoding [, errors]]])
以下のモードのうち一つを使って、object のUnicode 文字列バージョンを返します:

もし encoding かつ/または errors が与えられていれば、 unicode() は 8 ビットの文字列または文字列バッファになっているオブジェクトを encoding の codec を使ってデコードします。 encoding パラメタはエンコーディング名を与える文字列です; 未知のエンコーディングの場合、LookupError が送出されます。
 エラー処理は errors に従って行われます; このパラメタは入力エンコーディング中で無効な文字の扱い方を指定します。errors'strict' (標準の設定です) の場合、エラー発生時には ValueError が送出されます。一方、'ignore' では、エラーは暗黙のうちに無視されるようになり、'replace' では公式の置換文字、U+FFFD を使って、デコードできなかった文字を置き換えます。

codecs モジュールについても参照してください。

オプションのパラメタが与えられていない場合、 unicode()str() の動作をまねます。ただし、8 ビット文字列ではなく、 Unicode 文字列を返します。もっと詳しくいえば、 object が Unicode 文字列かそのサブクラスなら、デコード処理を一切介することなく Unicode 文字列を返すということです。

PR
makedirs( path[, mode])
再帰的なディレクトリ作成関数です。 mkdir() に似ていますが、末端 (leaf) となるディレクトリを作成するために必要な中間の全てのディレクトリを作成します。末端ディレクトリがすでに存在する場合や、作成ができなかった場合には error 例外を送出します。mode の標準の値は 0777 (8進)です。 (Windows システムにのみ関係することですが、Universal Naming Convention パスは、`\\host\path' という書式のパスです) バージョン1.5.2 以降で新規追加された 仕様です。

 

パイソンレシピ

複数の配列型をまとめて反復するには、zip関数を使います。 

 >>> a=['apple','orange','lemon']
>>> b=[10,20,30]
>>> for fruit,qty in zip(a,b):
...     print "There are",qty," ",fruit
...
There are 10   apple
There are 20   orange
There are 30   lemon


忍者ブログ [PR]
お天気情報
カレンダー
03 2024/04 05
S M T W T F S
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
リンク
フリーエリア
最新CM
最新TB
プロフィール
HN:
No Name Ninja
性別:
非公開
バーコード
ブログ内検索
P R
カウンター
ブログの評価 ブログレーダー