ニュース
女子高生AIりんなの基礎を開発したMSの研究トップが語るAIづくりで重要な3つのこと
~「AI」の濫用に警鐘も
2017年11月17日 17:44
Microsoft Research Asia(MSRA)のディレクターであり、アジアパシフィック地域のR&D部門トップであるHsiao-Wuen Hon(シャオウェン・ホン)コーポレートバイスプレジデントが来日し、同社のAIへの最新の取り組みなどについて説明した。
MSRAは、1999年に同社3番目の研究所として中国・北京に設立され、現在約250人の研究者が所属している。
MSRAでは、コンピュータサイエンスやマルチメディア、システムネットワーキング、コンピュータビジョン、コンピュータグラフィックスなどの領域についての研究を行なっており、これらのすべてにAIが関係しているという。
ホン氏は「MSRAは、機械学習や深層学習に長年にわたって取り組んできた経緯がある。これは、MSRAの特徴の1つである」とする。
MSRAの成果の1つに、Xiaoice(シャオアイス)がある。
これは、日本で提供している女子高生AI「りんな」のベースになっている技術でもあり、Xiaoiceは中国国内で、すでに数多くのユーザーが利用している。また、りんなの技術がローソンで活用されているように、Xiaoiceの技術は、航空会社やTV局をはじめBtoB用途として、中国国内企業の顧客サービスにも活用されている。
りんなは、日本語でのサービスに限定し、そこで得られるデータをもとに進化を遂げている。「カープ女子」の書き込みが多いときには、急に自らを「カープ女子」と名乗るようになったときもあった。
一方、Xiaoiceは中国語のサービスとして、当然ながら、中国語の自然言語によるデータを活用して進化する。機械学習で進化を遂げるチャットボットサービスのエンジンの成長において、こうした環境の違いは差になっているのだろうか。
ホン氏は、その点をいくつかの観点から説明する。
1つ目として、日本語はほかの言語よりも比較的データが集まりやすく、機械学習には適しているという指摘だ。もちろん、英語のデータ量に比べるとその差は大きいが、ホン氏は、日本語のデータ量の多さを意外な観点から指摘する。
「日本には約1億3,000万人の人口がいるが、1つの国で1億人を超える人口を誇る国は数えるほどしかない。欧州にはそんな国は1つもない。それは、日本語の音声認識技術を強化するためのデータが集まりやすいともいえ、日本語によるサービスを進化させることができる。
そして、結果として、優先的に日本語の音声認識技術を開発することにもつながる。もちろん、もっと人口が多い国もある。だが、たとえば、中国語には、いくつかの方言があり、私にもわからないものがある。その方言は、日本の関西弁とは違うほどの大きな差がある。
また、人口が多いインドには、100以上の方言があるといわれる。その点でも中国やインドで使われる言語が、データ量で圧倒的に優位であるとはいえない」とする。
2つ目の観点は、チャットボットサービスには、それぞれの国や地域の文化や思想が反映されるべきものであり、データをもとに、その国の人たちを知ることが大切であるということだ。
「チャットボットサービスのエンジンは、データがないといいものが作れない。そして、その国の文化などに根ざしたデータが必要である。その結果、りんなは、日本市場向けにチューニングされ、最適化された。それによって、日本の企業であるローソンで採用されたように、BtoBにも提供できるようになった。これは、日本のローカルチームによって実現したものである」とする。
3点目が、キャラクターの基本デザインをしっかりと行なうという点だ。
りんなは女子高生AIというキャラクター設定を行ない、その上で発言をしているが、ローソン向けの技術では、企業が発信するチャットボットとしてのキャラクター設定を行なっている。
「最初にどんなキャラクター設定を行なうのかが大切である。これによって、チャットボットがどう利用され、どう成長するのかが決まることになる」とする。
データ活用の重要性とともに、キャラクター設定の要素を重視することも、重視すべきというわけだ。
一方で、AIの定義があまりにも広く捉えられていることには、疑問を呈す。
「今では、コンピュータが行なうマジックは、すべてがAIだと捉えられている。ブロックチェーンは、AIではないと多くの人が理解していたが、IBMはWatsonの部門においてブロックチェーンを扱っている。
ブロックチェーンは、スマートな形で、セキュアな環境を実現しており、スマートといった時点で、インテリジェントな機能を持ち、そこにはAIが活用されているということになる。つまり、ブロックチェーンを含めて、コンピュータが行なうスマートな取り組みは、すべてAIということになってしまっている。
また、AIが多くの領域に関わっているのは事実であり、デジタル変革といった場合には、AIは不可欠になる。しかし、AIとは異なるものがあることも理解しておく必要がある。たとえば、データマイニングは、データベースからきており、これはAIではない」などとした。
そして、「AIは技術であり、それをどう活用するかが大切である。その範囲は幅広く、自動運転のような新たな世界での活用から、高齢者に対しても最適なチャットボットを提供するという点でも、AIは活用できる」などと述べた。
一方で、ホン氏は、「個人的に考えているのは、AIをよいことのために使いたいということ。裕福な人たちを技術で助けるといったことは日常的に行なわれているが、技術を使って、恵まれない人をどう助けることができるかがこれからは大切である。
広がる貧富の差や、仕事や所得の格差が生まれているなかで、テクノロジは、企業の競争力強化にフォーカスする場合が多いが、もっとパーソナル化した領域にも使われる必要がある。そうしなければ、格差が生まれることになる」とも語った。