ニュース
Apple、高解像度画像を効率よく生成するオープンソースAIモデル
2024年8月14日 15:20
米Appleは9日(現地時間)、オープンソースの画像生成AIモデル「Matryoshka Diffusion Models(MDM)」をGitHubで公開した。
MDMは、既存の拡散モデルが抱えていた複雑さと非効率性を軽減し、高解像度画像を生成する際の学習速度と計算リソースの効率化を図る手法。
小規模な入力の特徴量とパラメータが大規模入力のそれにネストされる「NestedUNet」アーキテクチャを用いており、これによって低解像度から高解像度の画像を並行して生成し、各画像間で特徴の共有を行ない、高解像度画像生成時の生成速度と画像品質の最適化を図っている。
研究チームではクラス条件付き画像生成やText to Image、Text to Videoなど様々なベンチマークでMDMの有効性を検証したといい、成果の一例としては、最大1,024×1,024ドットでのモデル学習に成功したことを挙げている。ここでは1,200万組の画像/テキストからなる「Conceptual 12M(CC12M)」データセットを用いて、ゼロショット(事前学習データから未知の概念を認識する)汎化を達成したとしている。
またAppleはGitHubにおいて、MDMの学習用Pythonパッケージ「ml_mdm」も公開している。
楽天市場 売れ筋ランキング
Amazon売れ筋ランキング
Anker Soundcore P40i (Bluetooth 5.3) 【完全ワイヤレスイヤホン/ウルトラノイズキャンセリング 2.0 / マルチポイント接続 / 最大60時間再生 / PSE技術基準適合】ブラック
¥7,990
Anker Soundcore Life P2 Mini【完全ワイヤレスイヤホン / Bluetooth5.3対応 / IPX5防水規格 / 最大32時間音楽再生 / 専用アプリ対応】ピンク
¥4,990
イヤホン bluetooth ワイヤレスイヤホン 48時間の再生時間 重低音 LEDディスプレイ表示 小型/軽量 IPX7防水 ブルートゥース 接続瞬時 Hi-Fi ブルートゥースイヤホン Type-C 急速充電 ぶるーとぅーすイヤホン iPhone/Android/Pad適用 スポーツ/通勤/通学/WEB会議 (ホワイト)
¥39,999
Anker Soundcore Liberty 4(Bluetooth 5.3)【完全ワイヤレスイヤホン/ウルトラノイズキャンセリング 2.0 / 3Dオーディオ / ワイヤレス充電/マルチポイント接続/外音取り込み / 最大28時間再生 / ハイレゾ / IPX4防水規格 / ヘルスモニタリング/PSE技術基準適合】ミッドナイトブラック
¥14,990
Apple AirPods Pro 2 + 延長2年 AppleCare+ for Headphones - AirPods Pro
¥42,792
GBAD (Number_i Remix) [Explicit]
¥250
もうどうなってもいいや
¥250
もうどうなってもいいや
¥250
GBAD (Number_i Remix) [Explicit]
¥250
TWILIGHT!!!
¥250
by Amazon 天然水 ラベルレス 500ml ×24本 富士山の天然水 バナジウム含有 水 ミネラルウォーター ペットボトル 静岡県産 500ミリリットル (Smart Basic)
¥1,173
い・ろ・は・すラベルレス 2LPET ×8本 【Amazon.co.jp限定】
¥1,104
コカ・コーラ い・ろ・は・す天然水ラベルレス 560ml ×24本
¥2,131
by Amazon 炭酸水 ラベルレス 500ml ×24本 強炭酸水 ペットボトル 500ミリリットル (Smart Basic)
¥1,360
キリン 自然が磨いた天然水 ラベルレス 水 2リットル 9本 国産 天然水 ミネラルウォーター ペットボトル 軟水
¥2,722