森山和道の「ヒトと機械の境界面」

感情豊かな合成音声でアンドロイドや自動応答もより自然に

~感情調整機能搭載の音声合成エンジン「AITalk4」が発売に

AITalkを用いてるアンドロイドの「アスナ」

 株式会社エーアイは8月3日、音声合成エンジンの新製品「AITalk4」を9月1日から発売すると発表し、記者会見を行なった。喜び/怒り/悲しみの感情表現を音声合成で実現したという。今までの「AITalk」は平坦な喋り方なので、ナレーション読みは得意だったがセリフなどの表現は苦手で、会話にすると不自然という難点があった。新製品では、より自然な会話調の対話が可能になる。音声ファイル作成ソフト「AITalk4 声の職人」の価格は596,000円。9月30日までの発注分限定でキャンペーン価格も用意される。

 新製品の「AITalk4」は、感情調整機能が搭載され、デスクトップ上でナレーションを作る音声ファイル作成ソフト「声の職人」、それと組み込み機器用のSDKが発売される。代表取締役社長の吉田大介氏は「今回が新バージョンの初お披露目。どこが違うのかを楽しみに聞いてもらいたい」と語った。

 従来はセリフが苦手で会話形態では不自然さが残ったが、今回からは感情表現を加えることができ、表現力が豊かになり、より自然な会話が可能になったという。話者は「のぞみ」、「まき」、「れいな」、「たいち」の4種類。感情調整機能は、喜び、怒り、悲しみなどの音声データから新たに作った音声辞書を元にしている。

 「喜び」には喜び用に新規に録音したデータから作った音声合成用辞書があり、「怒り」、「悲しみ」なども同様の仕組みになっている。そして、GUIの操作画面上で感情の係数をスライドバーで調整するだけで、喜んでいる感じや、悲しんでいる感じの音声合成になる。それに加えて、手動での音量、話速、高さ、抑揚調整も可能だ。

 エーアイでは今後、インターネット経由での音声対話、ロボット、ゲーム、書籍の読み上げなどさまざまなシチュエーションで使われることを目指すという。

「AITalk4」の操作画面。スライドバーで感情表現を調整できる
音量、話速なども変えられる
用途は音声対話やロボット、ゲームなど
4種類の「話者」が用意される
株式会社エーアイ代表取締役社長の吉田大介氏
【動画】感情調整機能搭載 AITalk4 「のぞみ」のデモ音声。喜び、怒り、悲しみの表現

肉声に近い音声合成は今どこまで来ているか

 エーアイは音声合成に特化した日本で唯一の会社だ。京都のけいはんなにあるATRで基礎研究を行なっており、その成果を反映させて事業展開をしている。同社の「AITalk」シリーズは人間の肉声に近い声が出せる音声合成エンジン。500社以上に導入実績があり、ナレーションやロボットやカーナビなどの組み込み機器、電話自動応答の音声として用いられている。例えばソフトバンクの「Pepper」、日テレの番組「マツコとマツコ」に登場する「マツコロイド」の声なども「AITalk」で作られている。

 総勢40種類以上の話者の声が出せ、言語の種類も15種類以上ある。また日本語の音声合成においては「AITalk Custom Voice」というオリジナル音声辞書作成サービスがある。芸能人や声優、自分の声などを収録し、音声合成用のオリジナル辞書を作ることができるものだ。一度辞書を作成すれば、文字テキストを入力するだけで本人のような声で喋らせることができる。ゲームやアプリ、キャンペーンなどに用いられているという。

 音声合成はそれ単体で完結するサービスではない。AITalkはほかのサービスと組み合わせて、クラウドやWebAPIなど顧客の利用状況に合わせたサービス提供ができることも強みだと、株式会社エーアイビジネスソリューショングループ マーケティングチーム ディレクターの伊藤裕介氏は語った。

 会見ではこれまでの導入事例も紹介された。例えば正確に正しくゆっくり読み上げることができる点を活かして、消防庁のJ-ALERT(全国瞬時警報システム)、自治体の防災行政無線などの防災用途に用いられている。組み込み機器としては、フードコート用の次世代呼び出しベルの案内キャラクター、アルコール測定器の音声などに用いられているという。京都駅ビルの館内放送、女満別空港ビルなどでも用いられている。またeラーニング教材、対話型ツールへの利用としてNTTドコモの「しゃべってキャラ」、Yahoo!の音声アシストなどにも使われている。

 また、同社の製品にはコンシューマ向けパッケージもある。「AHS VOICEROID」シリーズは、声優の声の録音から音声辞書を作成し、キャラクターおよび音声ファイル作成ソフト「声の職人」とセットにした商品。中には関西弁や東北弁で喋るキャラクターの製品もある。またヤマハの歌声合成ソフトウェア「VOCALOID」と共同で、女優の柴崎コウ氏の声を元に開発した「ギャラ子TALK」という製品もある。

ソフトバンクのロボット「Pepper」の声もAITalk
館内放送で使われている例
図書館の未返却本の一時督促が自動音声で行なっている例も
AHS VOICEROIDシリーズと「ギャラ子TALK」

ハンディキャップを持った人の社会活動にも

ビデオで出演した北区区議会議員の斉藤りえ氏。「今までよりも思いを伝えられれば」と語った

 会見では、聴覚障害のある「筆談ホステス」としても知られ、今は東京都北区区議会議員をしている斉藤りえ氏の秘書・増沢諒氏がユーザーとして登壇した。聴覚障害のある斉藤氏は、長時間に及ぶこともある議会での発言に音声合成を用いている。そこで使われているのがAITalkで、実際にソフトウェアの入力作業をしているのが増沢氏だという。

 ちなみにこれは、日本で初めて音声合成の議会の利用が認められた事例だという。増沢氏はAITalkの良い点として、その場で即座に打てることを挙げた。最初は代読というアイデアもあったが、それが時間制限や読む練習が必要であるなど難点があり、事前入力に加えて、カスタムできる点がいいという。また、AITalkでは再生しなくても作成したファイルが読み上げると何分ぶんのテキストなのかが分かり、この機能が便利だと増沢氏は語った。新製品については、講演会での和やかな会話が可能になるのではないかと述べた。

リアルな外見を持つアンドロイドにはリアルな合成音声

アスナの頭部。かなり自然な外見

 もう1人のユーザーとして登場したのが株式会社エーラボ代表取締役の三田武志氏だ。株式会社エーラボは、人間に似た外見を持たせたロボットであるアンドロイド研究で知られる大阪大学の石黒教授の技術を用いて、アンドロイドを製作している会社。三田氏は「バーチャルやCGでの体験もあるが『カタチにしてみる』ことは違う意味がある。例えば同じ空間の中でロボットを見るのと、YouTubeで見るのとではまったく違う感情を持つと思う」と語った。エーラボの技術については「必ずしも先端技術を使っているわけではない。だが『なんちゃって』でカタチにしてしまう」、そして「人前で見せることを大事にしている」と紹介した。「実際にはまだ先のものを持ってこよう」そして「ワクワクしよう」、「日本の技術を世界に発信しよう」といった点を重要視しているという。

 なお、同社では実在のモデルがいてその本人に近づけたアンドロイドを「ジェミノイド」、モデルはいないがリアルな人間のようなアンドロイドを「アルスマキナ」と呼んでいる。

株式会社エーラボ代表取締役 三田武志氏
まずはカタチにして出すことを重要視している
モデルのいるジェミノイドと、モデルのいないアルスマキナ

 アンドロイドは製作コストがかさむため、これまでは限られた場所・空間で使われていたが、これからはより安価になり、さまざまな状況で使われるようになるのではないかと三田氏は語った。今後、オリジナルのキャラクタを持たせた展開や医療福祉分野やマーチャンダイジングなどで用いられるようになり、アンドロイド自体が収益を生むようなかたちになっていくのではないかという。

 そのためのコンテンツビジネス用のアンドロイドとして製作されたのが「アスナ」だ。今は自由度は13で、首や眼球などしか動かない。駆動は空圧シリンダーである。重さは15kg。最初に公開されたときも首しかなく、腕や足などはお披露目するたびに稼いだ収益で徐々に付け加えられている。コントローラは現在外部に出されているが、年内には内蔵化を予定。今回、AITalkを使ってオリジナルの声が作られた。

アスナ。15歳の少女という設定
側面
首は若干太い。それ以外はほっそりしている
バストショット
瞬きのときだけキュッと音がする
【動画】AITalkを使った「アスナ」の声 ノーマルの合成音と感情表現付きの比較

 三田氏は、アンドロイドの難点として、リアルな外見であるがゆえに人と比べられること、何ができるのかと機能も追求されること、少しでも不自然な動きをすると多くの人が気づくことなどを挙げた。要するに見る人の側が、ハードルを上げてしまうのだ。声も同じで、そこで、「リアルな外見を持つアンドロイドにはリアルな合成音声ということでエーアイに作ってもらった」という。

 これからは個別のキャラクタ分けや多様な状況での感情表現などを追求し、声も使って「アスナ」の成長を表現したいと述べた。リアルな声とリアルなボディを組み合わせることで、エーアイとは色々な形でコラボレーションを行なっていくという。

 会場には記者たち以外に実際のユーザー企業も集まり、終了後には多くの名刺交換が行なわれていた。音声や歌声などでおなじみの企業の姿もあり、今後の活用が広がりそうな気配だった。

(森山 和道)