ニュース

顧客固有のビジネスに踏み込める「拡張知能」基盤としてのIBM Watsonの技術背景

~WatsonはほかのAIとどう違うのか

 日本アイ・ビー・エム株式会社(IBM)は11月16日、プレス向けにIBM Watsonの技術動向説明会を開催した。講師は同社 理事で、IBM Watsonソリューション担当の元木剛氏。テクノロジー面から見たWatsonと、他のAIシステムとの違いや特徴が解説された。

 なお、IBMではAIを「Artificial Intelligence(人工知能)」ではなく、「Augmented Intelligence(拡張知能)」、すなわち人間の知識を拡張し増強するものと定義している。IBM Watsonは、自然言語処理と機械学習を使用して、論文やWebページ、蓄積された過去データなど、収集された大規模非構造化データから人間にとっての最適解を提案するテクノロジー・プラットフォームであり、IBMが提供するコグニティブ・ソリューションの中核であるとされている。

 2011年2月には米国のクイズ番組「Jeopardy!(ジョパディ!)」でクイズ王に勝利して一般にも広く有名になり、その後、さまざまな領域でAI基盤としてWatsonビジネスを展開している。

日本アイ・ビー・エム株式会社 理事 IBM Watsonソリューション担当 元木剛氏

4層からなるIBM Watson

Watsonの4つのレイヤー

 Watsonは4層の特徴からなる。クラウド基盤、知識データベースを活用するためのツール、頭脳にあたる自然言語処理や機械学習などの技術をAPIで呼び出して活用できるAI活用基盤、そして統合基盤としてのアプリケーション・ソリューションのレイヤーだ。社内でも複数部門にまたがって多様な領域のソリューションとして活用されているという。

 なお、ソリューションとしては大きく分けると3つくらいのパターンがある。もともと質問応答システムだったWatson本来の照会応答、探索・発見、そして両者を組み合わせた意思決定支援アプリケーションだ。これがWatsonのアーキテクチャということになる。それぞれのレイヤーが高い拡張性を持っている点が特徴だという。とくにデータ層を重視しており、AI、ビッグデータという観点から、他のレイヤーからも切り分けて昨年後半から取り組んでいると元木氏は述べた。

 続けて各レイヤーについて解説が行なわれた。アプリケーション・ソリューションについては、個別の機能を提供する場合もあれば、統合したソリューションとして提供する場合もあり、運用においても多様だが、それらを実現できるような設計思想になっているという。とくに各顧客の業務に深く踏み込むために専門家集団を持っている。

 AI活用基盤としては、さまざまなAPI群を実現するために単一の技術ではなく、1つの機能をさまざまな技術で実装している。Watsonはディープラーニング(深層学習)はあまり使ってないのではないかと言われることもあるそうだが、そんなことはなく、従来の機械学習とも組み合わせて活用できるとアピールした。

 機械学習においてしばしば問題とされる、その過程をブラックボックスにしない仕組みもあるという。たとえばがん診断においてはどのようなエビデンスを元に判断したのか分からないと使えない。そのため、どの文献に重きを置いて判断したのか、どの文献にどんな重み付けをしたのかが示されるという。

 データの取り扱いは非常に大きなポイントで、企業ユーザーのためのシステムであるため、顧客固有の知見の入った固有データを扱うことになる。それをいかに生産性高く実装するか。そのために多くのツール群を実装していると述べた。

 たとえばデータは有償・無償のパブリックデータから抽出器を経て知識ベースとなる。そのまま使いたい場合は、コンシューマ向けのパブリックサービスとして公開することもできる。一方、購買契約書や企業内ポリシー文書、副作用テスト報告書などからなる固有のナレッジから固有のデータベースを構築したい場合は、公開データと組み合わせて抽出器を経て、それぞれ固有のWatsonインスタンスを構成する。

Watsonの特徴
顧客の固有データの活用と保護

Watson APIの進化

日本語Watson APIの進化

 Watsonの日本語APIは2016年2月に6つが公開されてスタートした。そのほかのAPIに関しても随時日本語化されており、いくつかは統合されている。現在は10個の機能が提供されている。日本語化のプライオリティは高く、今後も随時日本語化されていくという。各APIは単なるライブラリではなく、開発基盤としての側面もあり、それぞれ発展させている。高速の深層学習基盤も活用し、精度向上を加速しているという。

 コグニティブサービスには会話系、知識探索系、画像系、音声系、言語系などの種類がある。元木氏は会話系のチャットボットを例として照会応答ソリューション・フレームワークについて解説した。顧客と人間によるコールセンターの間に入ってサポートするシステムだ。ネスレ・ジャパン、日本航空、Autodesk、JR東日本、Bradesco、Woodsideなどで活用されている。

 なおWatsonの活用例についての詳細はこちら、APIについては「Watson APIs サービスカタログ」に詳しい。最初に導入されたときに比べると大きく進化しており、今では「成果が数値で取れつつある」と元木氏は語った。

Watsonのコグニティブサービス一覧
ソリューション事例

 照会応答ソリューションフレームワークである「Watson Conversation」はGUIを使って対話システムを作ることができる。機械が質問に対して正しく返答できてないときもGUIを使って、正しい返答を返すように編集することができる。

 機能は日々改善されており、とくに、質問意図の正しい理解、対話での文脈情報の活用、運用のなかでの学習のアシストなどの機能がここ半年で追加されたという。返答に対してユーザーが評価するシステムはよくあるが、それをよりよく活用できるようになっている。とくに改善案をWatsonが提案できる機能があると強調した。

 知識探索系のアプリケーションは、Watsonがもともと期待されていた部分だ。医療文献や法令文書、ニュース、あるいはソーシャルデータなどを読み込ませて、有用な知識を発見させる。利用は創薬やパブリックセーフティから始まったが、映像コンテンツの中身を検索できるようにしたりハイライトを発見させる活用例もある。元木氏は、これまでは個別領域に適用されていたが、API化されて、汎用的に活用できるようになったとアピールした。

 利用のためには、まず文書を集め(Ingestion)、自然文からの情報抽出と意味付け(Enrichment)、そして意味づけをインデックスに保持する(Query & Analyze)といった3ステップがある。Watsonには標準の分析器があるが、さらにたとえば医療研究など特定の業務領域に対しては追加のトレーニングをして、情報抽出と意味づけを行なう。そのためのツールを「Watson Knowledge Studio」として2016年に発表している。可視化するためのツールもある。

 照会応答型のフレームワークと、知識活用フレームワークは連携することもできる。たとえば過去の報告を見ないと答えが見つからない場合などには両機能を連携させて答えることになる。

照会応答ソリューションのフレームワーク
Watson Conversationサービス
改善学習提案機能
Watson Discovery
Watsonが学習する知識例
Watson Discoveryによる知識活用
「Watson Knowledge Studio」で専門領域の言葉を教えることができる
照会応答と知識活用フレームワークの連携も

カスタム分類ができる画像認識、音声認識の進化

 画像や音声は、AIサービスの入り口となるものだ。古くからある技術だが、今日大きく伸びた部分でもある。おおむね、深層学習を採用して精度が向上している。そこはほとんどのベンダーが共通している部分だが、Watsonの場合は、カスタム分類器に追加トレーニングができるという。

 たとえば犬や猫だけではなく、犬種まで見分けたいといった、各顧客固有のより詳しい分類が必要な部分について、短期間で、少ない学習データを用いて追加トレーニングができるという。具体例として、衛星画像を使ったカリフォルニア州の使用水量の分析、BMWによる部品の良品不良品分類、日本でもオートバックスセブンによるスマホを使ったタイヤ摩耗診断サービスに使われていると紹介した。

 音声認識も深層学習を入れることで急速に進化しつつあり、音声認識ベンチマークでは5.5%を達成している。この半年では最大6名までの話者検出、特殊用語に語彙を拡張できる言語モデルのカスタマイズ、ノイズに強い音響モデルのカスタマイズを行なってきた。

画像認識サービスによるカスタム分類が可能
音声認識精度も向上中

深層学習も高速化、開発期間とコストを短縮

 分散処理を使った深層学習トレーニングも高速化を果たしている。たとえばこれまでは10日間かかっていたニューラルネットワークのトレーニングを、7時間でほぼ同等、あるいはそれ以上の精度を出せるようになったという。

 こういった活動を踏まえて、できるだけすぐに立ち上げられて、使いやすいパッケージとする活動を続けていると述べた。期間だけではなくコストも短縮しているという。また11月1日からは無料で使える「IBM Cloud ライトアカウント」を開始。本番前に試す上では非常に有効な仕組みだと述べた。主要なAPIをはじめとする40のサービスが利用できる。

ディープラーニングの高速化
開発期間の短縮
「IBM Cloud ライトアカウント」を開始
無料で開発が可能