ニュース
IQテストでClaude 3がChatGPT-4超えのスコアを達成
2024年3月8日 14:19
TVプロデューサーでレポーターのマキシム・ロット氏は、複数のチャットAIを対象にIQテストを行なった結果、Anthropicの「Claude 3」がIQ100を達成したと自身のブログで報告した。
テスト内容はノルウェー版のメンサ。回答のばらつきを減らすために同じテストを2回行なった。Claude 3のほかには「ChatGPT-4」や「Bing Copilot」、「Gemini」、「Grok」、「Llama-2」なども対象としている。
ロット氏は2月にもチャットAIに対するIQテストを実施しており、このとき現行のチャットAIは画像パターンの詳細な認識が不得手であることを指摘していた。メンサのIQテストには画像を用いた設問もあるが、今回は設問の内容をすべて文章に起こして質問している。
IQテストのスコアはClaude 3が101、次いでChatGPT-4が85、Claude 2が82、Bing Copilotが79、Geminiが77.5と続いている。ロット氏の手法でランダムに回答した場合のスコアは63.5。一般的に人間のIQの平均値は90~109とされる。
記事の中では個々のチャットAIによる回答の一部も紹介している。一例としてはClaude 3が図形の変化を認識して回答のロジックを説明する様子や、Bing Copilotが質問の内容を正確に把握してアスキーアートを用いた視覚的な返答を行なった例がみられた。
ロット氏は今回のテスト結果を受けて、チャットAIの進歩の速さや不得手としている画像認識の課題について言及。現行のチャットAIではすべての質問に正確な返答を行なうことは現実的ではないとしつつも、4~10年後にはIQテストの設問にもすべて正解でき、"ほとんどすべての人類よりも賢い"水準のAIが登場する可能性を示唆した。ロット氏のテストでは人間向けのIQテストをAIに適用して一般人並みの回答が得られる例が示されたが、あくまでも一個人が独自の手法で実施したテストであることは考慮する必要がある。
楽天市場 売れ筋ランキング
Amazon売れ筋ランキング
Anker Soundcore P40i (Bluetooth 5.3) 【完全ワイヤレスイヤホン/ウルトラノイズキャンセリング 2.0 / マルチポイント接続 / 最大60時間再生 / PSE技術基準適合】ブラック
¥7,990
Anker Soundcore Life P2 Mini【完全ワイヤレスイヤホン / Bluetooth5.3対応 / IPX5防水規格 / 最大32時間音楽再生 / 専用アプリ対応】ブラック
¥4,490
イヤホン bluetooth ワイヤレスイヤホン 48時間の再生時間 重低音 LEDディスプレイ表示 小型/軽量 IPX7防水 ブルートゥース 接続瞬時 Hi-Fi ブルートゥースイヤホン Type-C 急速充電 ぶるーとぅーすイヤホン iPhone/Android/Pad適用 スポーツ/通勤/通学/WEB会議 (ホワイト)
¥39,999
Anker Soundcore Liberty 4(Bluetooth 5.3)【完全ワイヤレスイヤホン/ウルトラノイズキャンセリング 2.0 / 3Dオーディオ / ワイヤレス充電/マルチポイント接続/外音取り込み / 最大28時間再生 / ハイレゾ / IPX4防水規格 / ヘルスモニタリング/PSE技術基準適合】ミッドナイトブラック
¥14,990
Apple AirPods Pro 2 + 延長2年 AppleCare+ for Headphones - AirPods Pro
¥42,792
by Amazon 天然水 ラベルレス 500ml ×24本 富士山の天然水 バナジウム含有 水 ミネラルウォーター ペットボトル 静岡県産 500ミリリットル (Smart Basic)
¥1,173
い・ろ・は・すラベルレス 2LPET ×8本 【Amazon.co.jp限定】
¥1,104
コカ・コーラ い・ろ・は・す天然水ラベルレス 560ml ×24本
¥2,131
by Amazon 炭酸水 ラベルレス 500ml ×24本 強炭酸水 ペットボトル 500ミリリットル (Smart Basic)
¥1,512
キリン 自然が磨いた天然水 ラベルレス 水 2リットル 9本 国産 天然水 ミネラルウォーター ペットボトル 軟水
¥2,722