国内

音声認識技術 コンピューターに長時間覚えこませて性能向上

 地名を呼べば該当エリアが表示されるカーナビなど、最近すっかり身近になってきた音声認識技術。議会録作成のため地方議会でも導入され、“開かれた議会”の実現に向けて情報開示に役だっている。

「音声認識技術はひと昔前に比べると格段の進歩を遂げています。友人同士の打ち解けた会話を自動で起こすのはまだ難しいのが実情ですが、話術に長けた人が不特定多数に理解してもらおうとゆっくり明快に話すのであれば、高い精度で音声を認識することができるんです」

 と、音声認識の第一人者である京都大学の河原達也教授は話す。

 人間の話す音声をコンピューターを介して文字に変換する音声認識の研究は、日本では約50年前に始まった。だが、当時は大型計算機のような装置を何台も駆使して、一音一音区切りながら「わ、た、し」と発音すると、数十秒後に「わ…た…し」と出てくるレベル。

 地道に進化したものの実用化できるようになったのは、コンピューターの処理能力が高速化し大容量化したここ10年くらいのことだ。

「音声認識というのはデータ勝負なんですよ。たとえば英語を学習するときに何百時間も会話を聞いていると、だんだん耳が慣れて聞こえるようになるでしょう。コンピューターも同様で、音声データを何百時間分も覚えこませると性能がよくなるんです」

 河原教授は8年前から議会録作成用の技術開発を始めたが、開発の過程には様々な困難が伴った。

 認識の精度を上げるには大量の話し言葉をコンピューターに学習させる必要があるが、最大のネックは議場で交わされたリアルな音声を書き起こしたデータが少ないことだった。そこで文章化された過去の議事録から、“話し言葉では冒頭に「えー」という語が何%の確率で入る”とか“文末は「~ですね」と結ぶ確率が何%程度ある”と統計的に分析・モデル化。音声認識とは逆方向のアプローチをすることで、よりリアルな音声データを再現し、コンピューターに覚えこませたのだった。

「この手法により過去の議会禄をリアルに再現することが可能になり、データ量が飛躍的に増えた。新たに開発された音声認識システムには約500時間分のデータが蓄積され、認識の精度が格段に上がったんです」(河原教授)

※週刊ポスト2011年10月7日号

関連キーワード

トピックス

2025年11月、ホーコン王太子とメッテ=マリット妃
《彼女は17歳だよ。きっと楽しいと思う》ノルウェー王室激震、エプスタイン元被告と次期王妃の“黒塗り”メール――息子マリウスは“性的暴行”裁判渦中 
NEWSポストセブン
現地では大きな問題に(時事通信フォト)
《トゥクトゥク後部座席での行為にタイ現地の人々が激怒》フランス人観光客の“公開露出”に目撃者は「丸見えだった」 入国ブラックリストに
NEWSポストセブン
父・落合信彦氏の葬儀で喪主を務めた落合陽一氏
「落合信彦の息子という記述を消し続ける時代があった」落合陽一氏が明かした、父について語り始めた理由“人の真価は亡くなった時に分かる”【インタビュー】
NEWSポストセブン
本来であれば、このオフは完成した別荘で過ごせるはずだった大谷翔平(写真/アフロ)
《大谷翔平のハワイ訴訟問題》原告は徹底抗戦、大谷サイドの棄却申し立てに証拠開示を要求 大谷の“ギャラなどの契約内容”“資産運用の内幕”が晒される可能性も浮上 
女性セブン
表舞台から姿を消して約1年が経つ中居正広
《キャップ脱いだ白髪交じりの黒髪に…》「引退」語った中居正広氏、水面下で応じていた滝沢秀明氏からの“特別オファー” 
NEWSポストセブン
菅直人・元首相(時事通信)
《認知症公表の菅直人・元総理の現在》「俺は全然変わってないんだよ」本人が語った“現在の生活” 昼から瓶ビール、夜は夫婦で芋焼酎4合の生活「お酒が飲める病気でよかった」
NEWSポストセブン
弾圧されるウイグルの人々(日本ウイグル協会提供)
【中国・ウイグル問題】「子宮内避妊具を装着」「強制的に卵管を縛る…」中国共産党が推進する同化政策・強制不妊の実態とは…日本ウイグル協会・会長が訴え
NEWSポストセブン
大場克則さん(61)(撮影/山口比佐夫)
《JC・JK流行語大賞は61歳》SNSでバズる“江戸走り”大場さんの正体は、元大手企業勤務の“ガチ技術者”だった
NEWSポストセブン
中村獅童と竹内結子さん(時事通信フォト)
《一日として忘れたことはありません》中村獅童、歌舞伎役者にならなかった「竹内結子さんとの愛息」への想い【博多座で親子共演】
NEWSポストセブン
週末にA子さんのマンションに通う垂秀夫氏
垂秀夫・前駐中国大使が中国出身女性と“二重生活”疑惑 女性は「ただの友達」と説明も、子供を含む3ショット写真が本物であることは否定せず 現役外交官時代からの関係か
週刊ポスト
青木淳子被告(66)が日記に綴っていたという齋藤受刑者(52)との夜の情事を語ったのはなぜなのか
《不倫情事日記を法廷で読み上げ》「今日は恥ずかしいです」共謀男性社長(52)との愛人関係をあえて主張した青木淳子被告(66)が見せていた“羞恥の表情”【住職練炭殺人・懲役25年】
NEWSポストセブン
六代目山口組の司忍組長も流出の被害にあった過去が(時事通信フォト)
《六代目山口組・司忍組長の誕生日会》かつては「ご祝儀1億円」の時代も…元“極道の妻”が語る代替わりのXデー