←RecordNow MAX3 ↑今月のインデックスへ

NEW PRODUCTS TESTREPORT

日本IBM
ViaVoice with ATOK15
ATOK15との連携で変換効率を高めた音声認識ソフト
TEXT:清水理史 Masashi Shimizu


 日本IBMから、音声認識ソフト「ViaVoice」シリーズの最新版「ViaVoice with ATOK15」が発売された。文字どおり、同社の音声認識ソフトのViaVoiceとジャストシステムの日本語変換ソフト「ATOK15」を融合させた製品となっており、ATOK15の優れたかな漢字変換機能を利用できるのが最大の特徴だ。

 とはいえ、ViaVoice with ATOK15は従来のViaVoice V9とは少し方向性の異なる製品になっている。この製品は、ATOK15の音声対応機能(Voice ATOK)を利用して、ViaVoiceの音声認識エンジンを利用する仕組になっているのだが、ViaVoiceとして提供される機能は音声認識エンジンとIBM音声合成エンジンのみとなっている。通常版のViaVoice V9では、これらの核となるエンジンに加えて、音声専用ワープロの「SpeakPad」、Windowsの音声操作機能などが提供されるが、今回の製品ではこれらの機能は提供されない。つまり、純粋に文章入力に特化した音声認識ソフトとなっているわけだ。

ATOK15の話し言葉モードで、Outlook Expressに音声入力してみた。クイックエンロールのみで利用すると、やはり「そのうち」や「こっち」などがうまく変換されない 句読点の自動挿入も可能。ただし、ViaVoiceの辞書を利用した場合はあまり精度が高くないので、場合によっては、OFFにしてキーボードと組み合わせて入力する

音声入力の方法は3タイプが用意されている。ATOK15の能力をフルに活用したい場合は、「音声タイプモード」での入力が最適だ
 このため、使い方も従来のViaVoiceとは多少異なる。音声入力の方式には、音声を未確定状態で表示し、ViaVoiceの辞書でキーボードから変換を行なう「音声候補モード」(ATOK15辞書に手動で切り換えが可能)、音声を一旦、ひらがなに戻して表示し、ATOK15の辞書で変換を行なう「音声タイプモード」、ViaVoiceの辞書で変換された音声が直接表示される「ダイレクトモード」の3種類が用意されているが、それぞれで利用する辞書が異なるため、どのモードでATOK15が利用されるかを把握しておかないとうまく変換できないのだ。標準では音声候補モードとなっているので、ATOK15の機能をフルに活かしたいのであれば、音声タイプモードで利用するのがよいだろう。

 肝心の変換効率だが、これはATOK15を利用しているだけあってさすがに優秀だ。文節ごとの係り受けや文節の区切りなどが高い精度で判別されることはもちろん、ATOK15ならではの「話し言葉モード」、「話し言葉関西モード」などの変換も利用できる。これまでのViaVoiceは、新聞の文章のような、いわゆる堅い言葉の認識精度は高かったが、友人と交わすメールのようなくだけた文章の認識率は低かった。これがATOK15のおかげでスムーズに認識されるようになったわけだ。とくに句読点を自動挿入する場合、ATOK15の辞書を利用するとかなり高い精度で句読点が挿入されるようになることが確認できた。

 ただし、実際にスムーズに認識されるようになるまでには、それなりに使い込む必要がある。とくにくだけた表現では、エンロールでかなり学習させないと「~だけど」や「~だよ」といった表現が誤認識されてしまう。堅い表現であれば数分で終了するクイックエンロールでも十分だが、このような認識をさせたい場合は十分にエンロールを行ない、自分の音声のクセを学習させる必要がありそうだ。

認識率を向上させるためにはエンロールが必須。画面に表示された文章を読んでいけば、そこからクセを学習し、認識率を高めることができる
 また、ATOK15の辞書を学習させる作業も重要だ。一般的なIMEにおけるキーボードからの入力でも辞書を使い込んで、自分のクセに合わせた変換を学習させないと使いにくいが、それと同じことが音声認識でも言える。幸い単語登録などは、ATOK15から行なうことで、ViaVoiceの音声認識辞書にも反映されるので手間はかからないが、実際に音声での入力を思いどおりに変換できるようにするまでには、かなりの時間を要するだろう。

 ちなみに、このViaVoice with ATOK15は対応するアプリケーションを問わず、一般的なワープロソフトや表計算ソフト、メールソフトなど、どのようなアプリケーションでも利用できる。使いこなすためには、時間と根気が必要だが、鍛え上げてしまえば強力なツールになることは間違いない。本格的な文章作成に音声入力を使いたいユーザーに最適なソフトと言えるだろう。

・製品名:ViaVoice with ATOK15
・標準価格:15,800円
・問い合わせ先:日本IBM
・TEL:0120-04-1992(ダイヤルIBM)
・URL:http://www.ibm.com/jp/
・対応OS:Windows XP/Me/98 SE/2000/
・動作環境
・CPU:Pentium II 333MHz以上
・メモリ:256MB以上(Windows XP)
     64MB以上(Windows Me/98 SE)
     96MB以上(Windows 2000)
・HDD:200MB以上

■写真撮影
若林直樹(STUDIO海童)

□日本IBMのホームページ
http://www.ibm.com/jp/
□製品情報
http://www-6.ibm.com/jp/voiceland/products/ATOK/
□関連記事
【3月18日】日本IBM、ATOKと連動した高精度の音声入力ソフト「ViaVoice with ATOK15」
http://pc.watch.impress.co.jp/docs/2002/0318/ibm2.htm

(2002年5月24日)


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp
個別にご回答することはいたしかねます。
Copyright (c) 2002 impress corporation All rights reserved.