2009-02-22

ひらがな・カタカナを扱う Python 2.x モジュール (kana-r1345.zip)

katakana(s)
文字列 s 内のひらがなをカタカナに変換。

>>> print kana.katakana(u'あいうえお')
アイウエオ
hiragana(s)
文字列 s 内のカタカナをひらがなに変換。

>>> print kana.hiragana(u'アイウエオ')
あいうえお
hankaku(s)
文字列 s 内の全角文字を半角文字に変換。

>>> print kana.hankaku(u'パンダ')
パンダ
zenkaku(s)
文字列 s 内の半角文字を全角文字に変換。

>>> print kana.zenkaku(u'パンダ')
パンダ
upper(s)
文字列 s 内の小書きのかなを非小書きのかなに変換。

>>> print kana.upper(u'キャッツアイ')
キヤツツアイ
lower(s)
文字列 s 内のかなを小書きのかなに変換。

>>> print kana.lower(u'キヤツツアイ')
キャッッァィ

(「キャッツアイ」になると思った人、残念でした!)

voiced(s)
文字列 s 内の清音かなを濁音がなに変換。

>>> print kana.voiced(u'カンタム')
ガンダム
unvoiced(s)
文字列 s 内の濁音がなを清音かなに変換。

>>> print kana.unvoiced(u'ジャイアン')
シャイアン
semivoiced(s)
文字列 s 内の清音かなを半濁音がなに変換。

>>> print kana.semivoiced(u'あさごはん')
あさごぱん
row(c)
かな文字 c の五十音表での行を返す。

>>> print kana.row(u'つ')
た
col(c)
かな文字 c の五十音表での段を返す。

>>> print kana.col(u'つ')
う
normalize(s)
かなを辞書順にソートするために文字列 s を正規化する。sort 関数の key 引数に渡して使うことを想定しています。

>>> print kana.normalize(u'インターネット')
インタアネット
>>> print kana.normalize(u'金子みすゞ')
金子みすず

バグなどあったらご報告ください。

さて、あと何か必要そうなのある?