« 2006年11月 | メイン | 2007年02月 »
2007年01月01日
ルー語変換を MeCab だけで実現
巷で話題のルー語変換.周りにこういうしゃべり方をする人がいるからかもしれませんが, 爆笑しました中身は,MeCab -> EDICT -> Bilingual Emacspeak だそうです. 単純な単語置換なので,MeCab を汎用テキスト変換ツールとして利用すればまったく同じことが MeCab だけで実現できます. やってることは単純で, MeCab の辞書の品詞フィールドをルー語にした辞書を作るだけです.対象のルー語がない場合は単語そのものを品詞に設定します.
通常は 「入力文字列 -> 品詞列」 の変換が行われます.上記のような辞書を作ると,品詞の部分がすべてルー語に置き換わって 「入力文字列 -> ルー語文字列」の変換が実現されます. しかも単語のつながりやすさや,出現しやすさは上記のような辞書を作っても CSV カラムの 2,3,4 カラム目に残っているので, 原理的には MeCab の解析した後にルー語に変換したものと同じになります.つまり,単純な単語置換ではなくて,日本語の文法を考慮しながらそれなりに変換してくれます.
ここに ルー語変換用の MeCab 辞書をおいておきました. ファイルを展開して
% /usr/local/libexec/mecab/mecab-dict-index % mecab -d . < 変換したいテキストを実行してください.
形容詞も含めルー語独自の活用ルールをアプライしたので,オリジナルのシステムに比べさらにアグレッシブに変換します.
オリジナルテキスト
私は、特定の団体、特定の既得権を持った人たち、あるいはまた特定の考え方を持つ人たちのための政治を行うつもりはありません。毎日、額に汗して働き、家族を愛し、地域をよくしたいと願っている。そして日本の未来を信じたいと考えている普通の人たち、すべての国民の皆様のための政治をしっかりと行ってまいります。そのために、本日、「美しい国創り内閣」を組織いたしました。
MeCab版 ルー語変換
私は、スペシフィックのオーガニゼイション、スペシフィックのベスティドゥ権をホウルドゥした人たち、あるいはまたスペシフィ ックのウェイオブスィンキングをホウルドゥする人たちのためのポリティクスをパフォームするつもりはありません。エブリデイ、額に汗してワークし、ファミリーを愛し、エアリアーをよくしたいとディザイアーしている。そしてジャパンのザフィゥーチャーをビリーブしたいとコンシダーしているジェネラルの人たち、すべてのナショナルの皆様のためのポリティクスをしっかりとゴーしてまいります。そのために、トゥデイ、「ビューティフル国メイクしキャビネットゥ」をオーガニゼイションいたしました。
ルー語変換
私は、スペシフィックのオーガニゼイション、スペシフィックのベスティドゥ権を持った人たち、あるいはまたスペシフィックの考え方を持つ人たちのためのポリティクスを行うつもりはありません。毎日、額に汗して働き、家族を愛し、エアリアをよくしたいと願っている。そして日本の未来を信じたいと考えているジェネラルの人たち、すべての国民の皆様のためのポリティクスをしっかりと行ってまいります。そのために、トゥデイ、「美しい国創りキャビネットゥ」をオーガニゼイションいたしました。