山田祥平のRe:config.sys

生成AIから行動AIへ

 言語生成AIの社会実装を進める東京大学松尾研究室発・AIスタートアップの株式会社ELYZAが、企業が独自の大規模言語モデル(LLM)を構築するための支援プログラムの提供を開始するそうだ。LLMのポストトレーニングに注力した支援施策で、特定業務特化の独自LLMを低コストで完成させられるという。

AIが代替する何か

 ELYZAは、大規模言語モデル(LLM)によるホワイトカラー業務のDXに果敢にチャレンジしているスタートアップだ。コールセンターや契約書対応、原稿作成、メール対応といった業務に携わるホワイトカラーの生産性を向上させることが目的だ。

 同社は先日、言語生成AIの現状・展望に関する勉強会を開催し、多くの情報が流通・錯綜するLLM領域について、いま社会で起きていることの本質や、今後日本社会全体が向き合っていくべき重要論点などを解説した。

 同社が日本語に特化したLLMをいち早く研究開発し、日本語テキストの分類問題などで、人間よりも高い精度を達成したのが2020年のことで、以降、長文要約AIやキーワードを入力するだけでAIが文章を執筆するELYZA Pencilなどが話題になった。

 当時、同社は「全国民のホワイトカラー業務の10%以上をAIを用いて代替できる可能性あり」としていた。個人的にもサービスを実際に試してみて、10%というのは実は控えめな数字なんじゃないかと感じたりもした。

 時間が経過し、その通りになりつつある。同社の重要顧客である「JR西日本お客さまセンター」では顧客対応業務の半自動化に成功しているし、マイナビ社では求人メディアでELYZAのAIが原稿を執筆しているそうだ。一部の求人原稿の作成業務を30%効率化しているということで、これはホワイトカラーを10%代替どころか、30%代替できるというふうにとらえることもできそうだ。

ChatGPTがAIシーンにもたらしたもの

 ChatGPTが2022年11月20日にOpenAI社から公開されたのは記憶に新しい。さらに、そこから半年にも満たない2023年3月にはGPT-4が登場、改良によって多言語で精度を向上させ、ねつ造率の低下を達成している。MirosoftはChatGPTへの投資を継続、それを使ったWindows CopilotやMicrosoft 365 Copilotの計画を進めている。また、GoogleやAmazon、Meta社の動向からも目が離せない。

 瞬く間に拡がった生成AIだが、2018年までの大規模言語モデル以前は人間には遠く及ばなかったとELYZAはいう。だが、2018年の10月から急激に精度が向上し、2019年6月には英語のテキスト認識で人間の精度を超えた。そこで何が起こったかというと、大規模データで事前学習した汎用性の高いLLMをベースに、個別の学習データを使ったわずかな追加学習で人間を超える精度に到達させることができるようになったのだという。

 その後、2022年、ChatGPTでは、言語を学ぶプリラーニングと多様なタスクに馴染ませるポストトレーニングで対話を実現するようになり、GPT-4として提供されるようになったわけだ。

2つのLLMトレンド

 今、LLMを取り巻く主要なトレンドとして、企業が独自のLLMを自社開発する動きと、社会実装に特化した業務効率化の動きがあるという。ELYZAによれば、社内ドキュメントを参照しながら対話するスコープは、各企業の中で注目度がきわめて高いのだそうだ。外部に出せない情報を内部だけで処理し、最終的に人間が確認して公式なアウトプットとすることができるからだと思われる。汎用LLMをベースに、自社ドキュメントでポストトレーニングすることで、独自LLMを完成させるチャレンジだ。

 今、LLM市場におけるコスト構造は、サービスやアプリの売上の4割近くが下位レイヤー、すなわちChatGPTのOpenAI社などに支払われるようになっている。しかも、GPUが不足していて、無制限に活用することができない状況もある。

 こうしたことからOpenAI依存度を低くするために独自のLLMを開発する動きが増えているという。今後は、事前学習済みモデルがオープンソースとして公開され、その活性化の可能性も期待できる。だからこそELYZAはトレンドやコストの観点からポストトレーニング基盤を究め、業界特有のタスクで精度が高いLLMの開発を目指すことにしたのだという。それが、冒頭に挙げた企業独自の大規模言語モデル(LLM)を構築するための支援プログラムの提供に至った経緯だ。

 同社の分析によれば、「所得が大きい/大卒、院卒など資格が必要な職種ほど影響を受ける可能性がある」ということで、AIの進化とその利用は控えめに見積もっても多くの人々の仕事に影響が及ぶ。その一方で、機械修理のエンジニア、アスリート、シェフなど身体を伴うものは変わりにくいとされているが、個人的にはそのうち多くはロボットに置き換わるようにも思う。言語で指示すると機能を自動操作してアクションするのが当たり前になり、物理世界でAIが行動することが可能になるからだ。半世紀以上前の鉄腕アトムのアニメは、いろんな面で現実となりつつある。手塚治虫はすごい人だと思う。

AIとつきあうためにまずは長生き

 結局のところ、コンピュータが働いて、人間の生産性を高めてくれれば、同じ生産性を得るために必要な人間は、今より少なく済むということだ。つまり人間が仕事を失う。脅威かもしれないが、コンピュータを使う側に立てれば仕事は失わなくてすむ。

 今は、人間がコンピュータにいろいろな作業/処理を頼み、その結果を、いろんな様式で受け取っている。同じ結果を得るために、頼むプロセスが簡略化され、機械に併せた特別な言語を使わなくてもすむようになり、さらに、結果が出てくるまでの時間も短くなる。となれば、脅威のメカニズムも変わっていくだろう。しかも短時間にだ。

 パソコンをグラフィカルなユーザーインターフェイス(GUI)で使うのが当たり前になるまでは、人間がコマンドと呼ばれる呪文を覚え、例外処理としてのオプションや引数を与えることで結果を得ていた。まさに専門家の真骨頂だ。

 GUIは、明確にコマンドを伝えることができないところを補うために、コンテキストメニュー、ショートカットメニューと呼ばれる体系を生み出した。また、プロパティという考え方も方向性が似ている。選択したオブジェクトに対して、できることを列挙し、何をするのかを人間に選ばせるわけだ。こうすればどうかという提案もする。

 コンピュータを熟知した人間にとってはわずらわしいが、そうでない人間にとってはやさしい操作で、たぶん望んでいたであろう作業が完結する。

 でも、もしかしたらGUIに慣れ親しんだこの30年間は無駄だったのかもしれないなと思うこともある。それに今のGUIは見えているものが多すぎてかえって迷うこともある。まるで、PCのフルキーボードよりもキーの数が多いTVリモコンのようだ。

 AIの進化は、本当にダイナミックなパラダイムシフトをもたらすのだろうか。とにかく当面は長生きすることを考えよう。この先の展開とある種の結末を見逃すわけにはいかない。