ニュース

東芝、画像に対して世界最高精度で質問に答えられるAI

 東芝は、画像に対する質問に、世界最高精度で回答できる質問応答AIを開発した。まずは、生産現場における安全性確保などの用途で活用。放送コンテンツや監視カメラ映像からのシーン検索などにも応用していくことになる。

 東芝 研究開発センター知能化システム研究所メディアAIラボラトリーの中洲俊信研究主務は、「汎用的な技術であり、外部企業などから要望があれば、コンシューマ用途などにも展開できると考えている」とした。

 新たに開発したAIは、画像に映る人物や物だけでなく、背景を含めた色、形状、状態などの情報を認識。それらに関する質問を行なえば、それに対する回答が得られることが特徴だ。

東芝 研究開発センター知能化システム研究所メディアAIラボラトリーの中洲俊信研究主務

 「従来は困難だった人物や物の場所や状況を反映した質問応答が可能になる」(東芝の中洲研究主務)という。

 代表的な従来型AIモデルとの組み合わせによって、74.57%の回答正解率を達成。質問応答AIの世界的な標準データセットにおいて、世界最高精度を実現したという。動画には対応していないが、そこから1秒単位で静止画を切り出して処理することにより、ほぼリアルタイムでの判定も可能だ。

今回の発表概要
従来のAIモデルと組み合わせて回答率を向上させ、世界最高精度を達成

 同技術は、ニューラルネットワークに関する国際会議であるICANN2021で9月14日に発表する予定であり、2023年度中に実用化を目指している。まずは、東芝デジタルソリューションズが製品化している製造業向けソリューション「Meisterシリーズ」での活用を目指す。

 活用シーンとして想定しているのが、生産現場における潜在的な危険(ヒヤリハット)要因を事前に検知し、安全性を確保するという用途だ。

 作業者が、「ジャケットを着ているか」、「帽子をかぶっているか」、「黒い絶縁マットの上にいるか」、「足場に物が落ちていないか」といったように、安全な作業環境を実現できているかどうかを、画像から確認できる。

 従来型のAIでは、帽子や作業着など、事前に学習したパターンを識別し、物体を検出する必要があった。また、帽子を着用しているかどうかを検出する場合にも、人物の頭部に帽子があることが検出できるように、判定機能を作り込む必要があった。さらに、画像からは、人や動物、工具などの物体の特徴のみを抽出するため、床などの非物体などは検出しにくいという課題があった。

 新技術では、物体情報だけでなく、非物体の検出に対応するため、領域特徴抽出の機能を搭載。「緑色の床」といった質問にも回答できる。また、単に質問内容を変えるだけで、必要な項目のモニタリングが可能になり、導入には専門的な知識が必要なく、判定機能を作り込む必要がない点も特徴だ。

安全確認などに使える
安全モニタリングで重要な非物体質問に対応

 「生産現場では、日々状況が変化し、点検項目の追加や変更が行なわれている。従来型のAIでは、あらかじめ定義されていないものや、現場で変化するものには対応が困難だった。新たなAI技術を活用することで、現場の状況が変わった場合にも、質問をするだけで、点検が可能になる。現場責任者が行なう作業員の安全性確保をサポートすることができる」とする。

 また、東芝 研究開発センター知能化システム研究所メディアAIラボラトリーの小坂谷達夫室長は、「従来のAIでは、データを学習したり、パラメータを与えたりする必要があり、利用者にも専門的な知識が必要であった。だが、新技術では、現場責任者がAIの技術を持っていなくても、文章で質問ができる点が強みである」と補足する。

東芝 研究開発センター知能化システム研究所メディアAIラボラトリーの小坂谷達夫室長

 さらに、中洲研究主務は、「従来技術では、物体の特徴を考慮していたため、画像に背景が表示されると、回答を誤りやすいという傾向があった。新技術では現場ごとのルールにあわせて作業員が所定の場所に立っているかどうかを確認することができるほか、汎用性の高い質問応答AIの実現により、画像と質問を用意するだけで済む。使用目的に合わせた作り込みを行なう必要がなくなる。生産現場の安全モニタリングに適用することで、現場の安全性向上と監督者の作業省力化の両立が期待できることを期待している」とした。

 今後は柔軟な安全モニタリングAIの実現に向けて、質問応答AIエンジンの強化などによるシステム開発を進めるほか、工場現場の画像におけるモニタリングの精度向上にも取り組むという。

 また、放送コンテンツや監視カメラ映像からのシーン検索などにも応用できることから、ビジネス用途での提案を模索。「芝生の上にいる犬、空を飛んでいる飛行機といった画像を、効率よく検出できるようになる。東芝のビジネスからすれば、ビジネス用途での利用になるが、外部企業から要望があれば、コンシューマ用途での利用も考えられる」(中洲研究主務)としている。