2010年4月1日木曜日

日本語音声認識の過程で

私は、日本語専門担当者として、サンプリングしたデータも抜き打ち的にチェックしていますが、かなりの人々が、漢字の、地名、人名、特殊な発音を、読み違えています。アメリカに20年近くいる、私が知っていることでも、日本にいる人達が結構間違えることがあります。

八ッ場ダム=やんばだむ、たまたまニュースを見聞きしてましたが、やつばだむ、と普通読んでしまいますね。
下院:げいん、と読む方がいました。かいん、アメリカの Congress のことですが。

音声認識では、読み間違い、発音し間違いに対応する必要がありそうですね。 Google 検索では、こうじゃないの、という提案が出て便利ですから、そういうことは、重要と思います。

私の子供たちなど、ひらがなは読めるようになってきますが、漢字はほぼ無力、またひらがなが読めても、意味がわからない、とか、外国育ちでなくても、日本育ちでも、漢字の読み方や意味は、大きな負担ですね。

自分の子供らを、世界標準の英語環境において、結果としてよかったかなと、自分の英語力のなさを考えて思いますが、どうでしょう。日本育ちの私ですが、性格に加えて、了見が狭く、視野も、人格も狭く、大変です、今でも。最初から、多民族多言語環境で、共通の英語を使うというところ、アジア人差別も少しされる環境が、地球を生きるのにいいじゃないかと。

こういう日本語の漢字や読み方のような、言語の特性の難しさを和らげる所を、コンピュータが手伝うのは、意義がありそうです。日本語の負担を減らし、その分のエネルギーを、もっと国際的な感覚に費やすとか。また、わが子らのような外国育ちが下手な日本語でもコミュニケーションしやすい下地となれば。

0 件のコメント: