ひらがな・カタカナを扱う Python 2.x モジュール (kana-r1345.zip)。
katakana(s)
-
文字列 s 内のひらがなをカタカナに変換。
>>> print kana.katakana(u'あいうえお') アイウエオ
hiragana(s)
-
文字列 s 内のカタカナをひらがなに変換。
>>> print kana.hiragana(u'アイウエオ') あいうえお
hankaku(s)
-
文字列 s 内の全角文字を半角文字に変換。
>>> print kana.hankaku(u'パンダ') パンダ
zenkaku(s)
-
文字列 s 内の半角文字を全角文字に変換。
>>> print kana.zenkaku(u'パンダ') パンダ
upper(s)
-
文字列 s 内の小書きのかなを非小書きのかなに変換。
>>> print kana.upper(u'キャッツアイ') キヤツツアイ
lower(s)
-
文字列 s 内のかなを小書きのかなに変換。
>>> print kana.lower(u'キヤツツアイ') キャッッァィ
(「キャッツアイ」になると思った人、残念でした!)
voiced(s)
-
文字列 s 内の清音かなを濁音がなに変換。
>>> print kana.voiced(u'カンタム') ガンダム
unvoiced(s)
-
文字列 s 内の濁音がなを清音かなに変換。
>>> print kana.unvoiced(u'ジャイアン') シャイアン
semivoiced(s)
-
文字列 s 内の清音かなを半濁音がなに変換。
>>> print kana.semivoiced(u'あさごはん') あさごぱん
row(c)
-
かな文字 c の五十音表での行を返す。
>>> print kana.row(u'つ') た
col(c)
-
かな文字 c の五十音表での段を返す。
>>> print kana.col(u'つ') う
normalize(s)
-
かなを辞書順にソートするために文字列 s を正規化する。
sort
関数の key 引数に渡して使うことを想定しています。>>> print kana.normalize(u'インターネット') インタアネット >>> print kana.normalize(u'金子みすゞ') 金子みすず
バグなどあったらご報告ください。
さて、あと何か必要そうなのある?