ニュース

ERATO石黒プロジェクトが子供型アンドロイド「ibuki」、ロボット対話制御システムなどを開発

~ロボットとの対話感が向上

 国立研究開発法人 科学技術振興機構(JST) ERATO 石黒共生ヒューマンロボットインタラクションプロジェクトは7月31日、「人間型ロボットによる対話の人間らしさの向上~自由に移動できる子供型アンドロイドも開発~」と題した記者会見を開催し、3つのロボットに関する発表を行なった。

 距離センサー、カメラ、マイクロフォンアレイなど、多様なセンサーを使った「マルチモーダル対話制御システム」を開発し、アンドロイド「ERICA(エリカ)」をより自然に相槌や聞き返しができるようにし、ロボットの存在感を向上させた。

 また、複数のロボットを用いた「マルチロボット対話制御システム」を開発し、社会的対話ロボット「CommU(コミュー)」による対話感を高めた。さらに、車輪で自由に移動できる子供型アンドロイド「ibuki(イブキ)」を開発した。

 今後、一緒に動くことで、人と体験を共有できる対話ロボットの研究用プラットフォームとして用いる。

ERICA(エリカ)
ibuki(イブキ)

実社会で対話サービスを提供できるロボットの実現を目指して

大阪大学 大学院基礎工学研究科 教授、株式会社国際電気通信基礎技術研究所 石黒浩特別研究所 所長・ATRフェロー 石黒浩氏

 2015年にはじまった「ERATO 石黒共生ヒューマンロボットインタラクションプロジェクト」の研究総括で、大阪大学 大学院基礎工学研究科教授、株式会社国際電気通信基礎技術研究所 石黒浩特別研究所所長・ATRフェローの石黒浩氏は、卓上の対話ロボット「ソータ」などのこれまでのロボットを振り返り、基本方針は「ヒューマンロボットインタラクションの新たな技術を開発して、実社会で対話サービスを提供するロボットを実現すること」だと改めて述べた。

 身体的なサポートだけでなく、心理的にも人を支えて、人のパートナーとなるロボットを開発し、将来的にはトータルチューリングテストをパスできるアンドロイドの実現を目指している。

 人間のように、多様な情報伝達手段を用いたインタラクション技術を開発し、さまざまな人に自然に接することができるロボットである。介護、公共施設、教育支援、情報提供などを想定アプリケーションとしている。

 ポイントとなる技術は3つ。人と安全に関われるメカニズム、特定の状況と目的における自律対話、社会的状況に対応するマルチモーダル対話機能である。

 ある程度状況を選べば現状の技術でも自然に対話できるし、複数のロボットを使うこともできるという。

人とロボットとのインタラクション
自律ロボットを実現する3つの技術

 研究には、大阪大学、京都大学、ATRの3チームが関わっている。ERATO石黒共生ヒューマンロボットインタラクションプロジェクトでは、女性型アンドロイド「ERICA」にすべての研究成果を集約させようと考えており、それぞれの機関に1体ずつ「ERICA」が設置されていて、それぞれ相互に運用しながら技術実装を進めているという。

研究開発体制
研究の開発と経緯

ロボットによる傾聴と面接

ERICAによる傾聴

 まずは「ERICA」に関して3種類のデモが行なわれた。最初に傾聴と面接、それと自分の欲求にしたがって対話を進めるデモが行なわれた。

京都大学大学院情報学研究科 教授 河原達也氏

 音声認識技術を担当している、京都大学大学院 情報学研究科教授の河原達也氏は、人間レベルの音声認識を目指していると述べた。

 ビッグデータとディープラーニング(深層学習)によって、技術は進展しているものの、スマートフォンやスマートスピーカーのような、一問一答形式の検索・命令を超え、さらにさまざまな環境で用いられるロボットとの自然な対話は、まだまだ難しいのが現状だ。

 人間はマイクがなく、機械でないものに対して発話すると、発話がくだける。それだけでなく、発話の区間検出自体が難しくなる。そのため、ロボットの場合はLED点滅などを発話タイミングとして示すことが多い。

 今回のERICAへ実装した技術では、自然な対話権制御を狙った。

 具体的には、認識時間を500ms以下にする必要があり、クラウド音声認識は使うことができない。そこで、GPUを搭載したノートPC上でEnd-to-Endの音声認識を実現。6秒の発話でも、200msで認識できる技術を開発した。

 これによって、長いやりとり、人間らしい存在感、相槌、うなずき、視線など、非言語情報を含む対話感の実現を目指した。

人間レベルの音声認識を目指す
実時間の30分の1で処理ができるという

 このプロジェクトでは、特定状況を設定して、自然な対話を実現しようと考え、京大チームでは1:1で長いやりとりを行なう傾聴(カウンセリング)、面接(インタビュー)を想定した。

 傾聴のためには、人間に気持ちよく長く話してもらう必要がある。それを自然な相槌、焦点となる単語を検出して聞き返す機能、「よかったですね」といった評価応答によって、ユーザーが話し続けられるようになったという。

ロボット対話タスクの分類
ERICAの傾聴技術

 従来も相槌を打つロボットはあったが、ワンパターンではなく、ユーザーの発話に応じて多様な相槌を打つことができる。高齢者に体験してもらったところ、10分程度の対話を継続できたという。

ERICAによる面接

 一方、面接の場合は、質問に応じて掘り下げ質問を返すというもの。こちらのほうは、人間が話終わったことを確認したあとに発話をはじめるようにしている。

 河原氏は「面接の練習には十分ではないか」と述べた。

ロボットとの雑談

ATR 石黒浩特別研究所 研究員 港隆史氏

 48個のマイクや距離センサーなど、各種センサーを使った人の認識、システム自身の意図や欲求表出などを組み合わせた対話生成については、株式会社国際電気通信基礎技術研究所(ATR)の港隆史氏が解説した。

 人間らしい日常対話ができることを目指し、アンドロイド自身の欲求、意図、対話相手の認識などに基づいた発話生成、発話にともなう視線や頭部、身振りなどの自動生成、そして聞き間違いなどで対話が破綻したときの自動修復技術を開発したという。

各種センサー情報を使って人の情報を推定する
ステージの花そのほかにもマイクやカメラが仕込まれている
研究室の受付で初対面同士という設定

 今回は、研究室の受付でたまたま会ったもの同士という設定で、初対面の対話を例にデモを作ったとのこと。

 ロボットと対面したときに、どのように話しはじめるか、そこをアンドロイドが対応し、かつ、自然と話しているうちに距離感がわかってくるような対話を実現することで、喋っている相手との関係性を考慮しながら対話を続けることができるという。ただし、あらかじめ設計したシナリオに限定される。

既存対話システムとの比較
ERICAが好みにしたがって話題を選択してシナリオ対話を実行する

 ERICAは、相手の感情や自分自身のステータス、複数の欲求から、話題を選択して会話を続けていく。

 必ずしも相手と仲良くなりたいということだけではなく、相手があまり話したくないと思っているようなら、ERICAのほうも対話を終わらせてしまう。一方、相手が自分の欲求が満たされるような話をしてくれると好感度があがり、さらに深い対話へと進んでいく。いわば空気を読むような対話だ。

 「相手に合わせて喋るところがミソ」だと港氏は述べた。

 ERICAが話しかけても人間が対話を続けようとしないと、ERICAのほうもあまり話をしなくなり、関係性のスコアもまったく上がらなくなる。自分自身の欲求と、相手を気遣う欲求のバランスをとりながら、対話相手に合わせることができる。

ERICAの初対面対話の流れ
欲求・意図・行動の階層
対話相手が自分にどの程度興味を持っているかも推定
デモの着目ポイント

複数台で連携して人と対話するロボット

大阪大学基礎工学研究科 准教授 吉川雄一郎氏

 「CommU」の研究については、大阪大学基礎工学研究科 准教授の吉川雄一郎氏が紹介した。

 これは卓上サイズのロボット「CommU」を使って、複数台のロボット同士の対話に人間を巻き込むことで、音声認識が不完全でも、対話が破綻なく続いているように見せることができるというもの。

 たとえば、人間の発話終了部分だけを検出して、別のロボットが対話に割り込んで、ロボット主導で会話を連続する。あるいは特定の単語だけを認識して、ロボット同士が対話する。

 それによって、人が話を聞いてもらえている感が高くなるのだという。高齢者向け施設で実験を行なっている。

 基本的に、音声認識が失敗しても、一貫性が高いと人が感じる対話を実現するための技術である。またロボット同士を連携することで、普段よりも積極的に話せるようにもなるという。

 人間の対話にはいくつかのレベルがあるが、この研究では「相手とのつながり」を感じる対話では、発話や表情への反応が途切れないことのほうが重要であるとし、対話を「ストーリーの共有」だと考えている。

 言葉だけを追うとつながってないような会話でも、人の側がストーリーを展開するための発話だと考えて、その対話に乗ってしまうため、対話自体は破綻しないのだという。また、このほうが、ロボットがこちらが喋っていることを理解していると主観的に感じる率が高いという。

「CommU」
NTT docomoと共同実験中の「CommU」。
対話実験の様子。下の箱はマイクロフォンアレイ
複数ロボットを使うことで発話しか認識しない対話、単語しか認識しない対話を可能にする
2体のロボットとのやりとりのほうが無視された感が少ない
割り込む言葉は多少ズレていてもかまわない
日本科学未来館での実証実験結果。ロボットが人の回答に関係なく対話を続けてしまっても、人は違和感をあまり感じずに対話が続いてると感じてしまう。

 今後は、音声認識とも組み合わせ、「音声認識なし対話を最低保障とした対話」技術を目指す。

 人間の会話は予想できない。まったく想定外で認識もできなかった場合、別ロボットが会話に割り込むことで、対話を破綻させないようにする。

 現在は、NTT docomoの技術協力を受け、高齢者向け共同研究を行なっている。

音声認識なし対話を最低保障とした対話
まとめ

自立移動できる子供型アンドロイド「ibuki」

子供型アンドロイド「ibuki」

 株式会社エーラボとの共同開発である、新作の自立移動できる子供型アンドロイド「ibuki」については、大阪大学基礎工学研究科助教の仲田佳弘氏が解説した。身長120cm、10歳の設定だ。

 関節自由度は47(頭部15、片腕6、首3、腰3)。表情や手のジェスチャーなどが行なえる。

ibuki。身長120cm
今回はハードウェアが完成したレベル
下半身は車輪
横顔
後面

 全身重量はバッテリ込みで37kg。上半身の重量は8kg。CFRPなどを用いて軽量化した。アクチュエータは電動で、5軸のDCモータドライバーを新規に開発して、関節をトルク制御する。

 ロボット用ミドルウェアの「ROS」を用いて外部計算機と連携できる。

ibukiの自由度
頭部の表情は変化させることができる
5本指を持った手
手の自由度

 偏心した車輪と直動機構の組み合わせによる、全身の揺動(ゆれ)機構と上半身の動きが特徴で、車輪型だが、子供のような雰囲気を醸し出している。

 これまでのアンドロイドは、空圧式アクチュエータを用いていたため、コンプレッサーが必要で、動くことができなかった。

 今回の「ibuki」は、電動化/バッテリを内蔵したことで動き回れるようになった。ごく軽いものなら持つこともできるが、あくまで作業ではなく、人と一緒に移動して体験を共有し、対話を行なうためのロボットだ。

 今後、ERICAやCommUで開発した技術をibukiにも実装していく。

開発者の大阪大学基礎工学研究科助教の仲田佳弘氏
今後の予定

 8月1日には、日本科学未来館で「第2回ERATO石黒共生HRIプロジェクトシンポジウム」が開催される。シンポジウム内でもロボット・対話制御システムのデモが行なわれる予定だ。

質疑応答に答えるERATO石黒共生HRIプロジェクトの研究者たち
記念撮影
人と体験を共有するロボットとする
ERICAとibuki