西川和久の不定期コラム
2024年を振り返る~公私ともにAI一色の1年!
2024年12月27日 06:26
今年2024年扱ったもの
毎年この振り返る記事の冒頭でその年扱った記事をカテゴリ分けし、それぞれ本数をあげているのだが、毎月4本×12=48(本原稿があるので-1)。バックナンバーや元原稿など見つつカテゴリ出しと本数を計算するのは、結果が単純な割に地味に手間がかかる。
そこで今回は少し前にご紹介した「Claude Desktop + MCP」でやってみる事を思いついた。
これはどういう意味か?それは上記の記事でデータベース(DB)とローカルファイルシステムをMCP経由し、Claude Desktopで扱う内容を書いたが、その応用編だ。
つまり、
- あるフォルダへ2024年分の原稿txtを集める(集計時は11月末まで。12月分3本は手動)
- DBにpcwatch tableを作り、カラムは月/カテゴリ/タイトル/ファイル名/概要
- 月はファイル名頭2文字の数字
- MCPを使い指定フォルダにあるテキストファイルを読みつつ、月毎にDBの各カラムを埋める
これで実行すると、
- ファイル名から月を抽出
- 内容を読み取り
- カテゴリ、タイトル、ファイル名、概要を抽出
- データベースに登録
以上が自動的に行なわれる。この時、カテゴリはこれとこれと言った細かい指示は一切していない。結果は以下の通り。
カテゴリはメインとサブで分かりやすくまとまっている上に、集計はAIの判断なのか勝手に作られている。筆者より優秀だ(笑)。これに12月3本を手動で加えた合計47本の内訳は以下の通り。
・ハードウェア系: 27件
Mini PC: 14件
タブレット: 6件
ノートPC: 5件
スマートフォン: 1件
PC: 1件
AI関連: 19件
画像生成: 10件
LLM: 5件
総合: 2件
動画生成: 1件
プログラミング: 1件
その他: 1件
OS/Linux: 1件
なるほど、ハードウェア系はミニPCが圧倒的に多く、AI関連は画像生成、続いてLLM。Linux何だっけ!?っと思ったら、1月に掲載した「メインPCをUbuntuにして約1年半で何が変わった?そして次期仕事用テスト環境を作る!」だった。
Apple M4 Max 128GB搭載のMacBook Pro 14に関してはどちらもハードウェア系/ノートPCになっている。後編はAI関連/LLMでもよかったかも知れない。
とは言え、このまとめ方、PCやAIに詳しくない普通の人だとまずこうならない。これらを知っているアシスタント君が一人いる感じだろうか。LLMが外部に接続できるとどうなるか?可能性を垣間見た気分だ。
印象に残っているものは?
さて、扱った中(自分で購入したもの以外)+PC Watchの記事で印象に残っているのは……。
まずこの2つ。ミニPCは主にプロセッサが違うだけなので、ある意味全部同じに見えてしまい個別の印象は薄い。もちろん高速で大容量なほど魅力的なのは間違いない(+OCuLinkも)。
その中で久々の「おっ!」となったのがこの2in1タブレット。ご存知のように筆者はMicrosoftのSurface好き(と言っても購入したのは初代から3までだが)、それにそっくりな「N100 Hi10 Max」が届き喜んだ次第。
12.9型3:2のパネル、キーボードバックライトありといった勘所も抑えてある。残念なのはプロセッサがN100と言うこと。少し古めの世代でもいいのでせめてCore i3だったら……的な感じだ。
次はハードウェアなのかソフトウェアなのか分類は難しいのだが、A100/80GBを初めて使った衝撃だろうか。もちろんローカルではなくクラウドGPUだが。
これを使うまでは、Google ColabのA100/40GBが最大だったので、さらに上のスペックとなる。AI関連においてVRAM容量はあればあるほど良い。家庭用での最大がGeForce RTX 3090/4090の24GB。それの約3倍なのだからもう……(笑)といった感想となる。
逆の意味で衝撃的だったのが10月に掲載したこれ。
最近のスマホに限られるが、PCと比較して、パフォーマンスやメモリ容量が小さいにも関わらずLLMが動いてしまった。しかも普通に日本語が扱える。来年、この辺りはどこまで行くのか?それも楽しみだったりする。
プロセッサに関してはモバイル向けでメモリ内蔵のCore Ultraシリーズ2と、デスクトップ向けArrow Lake-S(Core Ultra 200S)がいろいろな意味で気になった。
まずCore Ultraシリーズ2はプロセッサにメモリを内蔵。これはApple siliconと同じ手法だ。違うのはApple siliconの100GB前後搭載可能なのに対し、16GBもしくは32GBしか搭載していないこと。またメモリ帯域も最大546GB/s(M4 Max) vs 約136GB/s(LPDDR5X-8533/64bit×2接続)と随分違う。どうせならもっと大容量、そしてメモリ帯域も広くすればAI用途に向くだろうに……っと思った次第。
もう1つはデスクトップ向けArrow Lake-Sプロセッサ。普段筆者が使っているAI専用PC(Ubuntu + GeForce RTX 4090)が、モバイル向けCore i7-12650H(10コア(6P+4E)/16スレッド/最大4.7GHz)と、ちょっと妙なマザーボードな事もあり、もう少し強そうなのを……と、思っていたので興味深く発表関連の資料を眺めていたのだが、NPUが13TOPSとある。上記したモバイル向けプロセッサが48TOPSもしくは40TOPSなのになぜ?と言う感じだ。
少なくともデスクトップ向けは、すべてにおいてモバイル向けを凌駕してほしいところ。こんな出し渋りしているから傾くんだよ……っと思った次第だ。
購入したもの@2024年
今年(2024年)は過去に例がないほどの出費。合計を出したくない気分だ(笑)。AI目当てのノートPCだけでも凄まじいのに、加えてたまたま手元のスマホが「iPhone 13 Pro」と「Galaxy Z Flip 4」と、3年もしくは2年古かったこともあり、さらに……っと言った感じとなった。以降、大物だけご紹介したい。
まずメインモニターの買い替え。それまでのメインモニターはベンキューの「SW240」 。24型1,920×1,200ドット/ハードウェアキャリブレーション対応+フード(オプション)の構成で2020年に購入。映り的には全く問題ないのだが、文字が見にくくなってきたこともあり(24型1,920×1,200ドットで16ドットだと文字が細い)、27型4Kでいろいろ探していたところOLEDを発見!しかも(当時は)10万円ちょっと切る価格なので迷わず購入した。
言うまでもなく、OLEDなので映りは抜群。これを見た後、(それなりの価格の)液晶モニターを見ると?と思うほど圧倒的な違いがある。文字も太くなり目の疲れも軽減。一石二鳥で良い買い物となった。
上記のdGPU搭載ノートPCは、当初の予定を終え、今は机の上に鎮座している。余談になるが、これも含め現在自宅にあるdGPUは、
- GeForce RTX 4090 (24GB)
- GeForce RTX 3090 (24GB)
- GeForce RTX 4060Ti (16GB)
- GeForce RTX 4080 Laptop GPU (12GB)
合わせて1つにできればいいのだが、そうも行かないのが悔しいところ。来年(2025年)早々にはGeForce RTX 5090(多分32GB)が出そうなので購入予定。
これらだけでもかなりの金額になるのだが、そもそもNVIDIAがCUDA一強をいいことに、低容量/高額路線で適正価格を超える値段でGPUを売っているのが大問題。と言って今のところAMDとIntelの関係になるような競合もなく、価格コントロールは思いのまま。この辺り、来年はいきなりの競合が登場するか、CUDA以外の選択肢が急造されるか、相変わらずなのか!?
ただ、GeForce RTX 5090搭載の新アーキテクチャBlackwellはそろそろ限界な気がする。理由はクロックを上げ、超高TDP、高発熱……と、以前のCPUと同じ道を歩んでいるからだ。その後、CPUがどうなったかはご存知の通り。(Blackwellの)次世代が水冷必須とか電源1,000W以上とかでは洒落にならない。
続けてはスマホ。元々Galaxy Z Flip 4をメインで使っていたこともあり、(業界人としては)2年前のモデルだと買い替えタイミング。8月に渋谷でイベントをやっており、見に行ったその場で購入した。
ファーストインプレッション的には、真ん中の折り目があまり目立たなくなったことだろうか。サブディスプレイは大きくなったものの、時間や通知以外、あまり見ることもなく、であればZ Flip 4の小さいパネルの方がデザイン的には良かったのだ。
Z Flip 4はカバーをいろいろ買って失敗した。折りたたむと厚みが倍になるので、厚手のカバーはNG。最終的にアラミド繊維カバーに落ち着いたこともあり、今回は初めから狙い撃ち。余計な出費はかからなかった。
購入後、メインで使っていたものの、11月中旬、開いても表示しなくなることが多くなり、原宿のGalaxyショップで修理。2時間ちょっとで無事完了。おそらく初期不良に近い故障だと思われる。折り畳み式のスマホで開いて画面を表示しない時はかなり焦る(笑)。
iPhone 16 Proは、iPhone 13 Proからなので3年。使った感じなどは記事に書いてるので参考にしてほしい。Galaxy Z Flip 6の故障中から修理後しばらくの間、こちらをメインで使っていたが、どうにも我慢できずGalaxy Z Flip 6へ戻ってしまった。理由は厚みと重み、そしてカメラの(HDRとAI補正がごちゃ混ぜになった様な)不自然な写りとなるだろうか。
そして最後はこれ。M4 Maxを選んだ瞬間に50万円を超えてしまうため、であれば128GBを……と言うところ。当初の予定通りメインPC+主にLLMで使っている。
dGPUほどは速くないので、VRAMが100GBほどあっても爆速では動かないのだが、それでも動かないよりはずっといい。新型のLLMが出て、huggingfaceにMLX版があがると即試す感じだ。
さてこれらを使って何をしているのか?というと、生成AI画像を作りそれを売ってるわけではない。
いろいろなモデルの評価や、それを使えばどうなる的なコンサルティング、そしてGoとなった場合、サーバー構築はやればできるものの、そこは若い衆に任せてロジック検証のコードなどを書いている。その関係もあり、今年は9割ほどがPythonだった。去年(2023年)は2割がPython、残り8割はLAMP系だったことを考えると激変だ。
撮影も激増。大半は女性なのだが、従来撮影していたグラビア的なものではなく、AI学習用素材の撮影だ。何から何まで過去の仕事がAIにつながって来た。
来年もどうやら今のペースのままAI一色になりそうな雰囲気。勉強すべきことが山盛りある。しかし60歳を超えてからこんなに宿題や勉強があるなんて思っても見なかった(笑)。
生成AI画像関連@2024年
生成AI画像に関しては、去年最後にSD 1.5@2023年3月、SDXL@2023年12月の画像を載せているが、この1年でどこまで変わったか?について少し触れておきたい。
今年2024年、流れが大きく変わったのは8月。「FLUX.1 [dev]」のリリースだ。SDXLの“リアルっぽい絵”から、“リアルな写真まであと一歩”のところまで来た感じとなる。順番に並べるのでその違いを見て欲しい。
これはJoyCaptionと呼ばれる一種のVLLMを使い、オリジナル(SD 1.5)画像の詳細をテキストとして書き出し、それをPromptとして使い似せる手法。
こちらはReduxという画像(ここではSDXL)の内容をまんま再現する仕掛けだ。前者はいったんPrompt化しているが、これはPrompt化せずダイレクトにSamplerへ情報を伝えているところが異なる。
そしてどちらもControlNet/Depthを使い、オリジナル画像から深度情報を得て、構図を(ほぼ)固定させている。これらの組み合わせによってオリジナル画像をコピーしつつ最新のFLUX.1 [dev]で生成可能となる分けだ。
加えて、元々1,216×832ドットなのでDetail Daemonと呼ばれる詳細を加筆しつつ1,920×1,280ドットへアップスケールした(一部3:2になるようトリミング)。
以上のような最新技術(特に2番目)を使い2024年12月、つまりたった1年でこれほどまでに進化したのがお分かり頂けるのではないだろうか?
ただ以前と少し変わってきたのは、FLUX.1 [dev]を筆頭に、そこそこの性能のものはオープンで出るのだが、さらに高性能モデルに関してはAPI経由、つまり課金対象のものが多くなってきた。オープンにしてしまうと一銭にもならないので、開発する側からすれば当然のこととも言える。
この流れ的に来年、FLUX.1 [dev]よりさらに高性能モデルがオープンで出るのか?という心配に加え、API経由の場合、Promptと出力の2段階で検閲が入り、出したいものが出せないという問題が発生する。現状、米国系は厳しい感じだ。
これはXの「Grok 2」やMicrosoftの「Image Generator(DALL-E 3)」、そしてGoogleの「Imagen 3」など、API経由ではなく、生成AI画像サービスも同様。
特にGoogleはひどく、“a japanese woman, 20yo , xmas cosplay , at shibuya japan.”……この程度のものすらろくに出せない。多くて4枠中2枠、ひどいと全滅(xmas cosplayがなくても大差なし)。一般常識をはるかに超えた度が過ぎる検閲=何も出せない生成AIなど、存在する価値はない。それどころか、いったん作って出す時に引っかかってるので、電力も含めリソースの無駄遣いでもあると思う。
これは先日発表のあった「Veo 2」(Googleの生成AI動画)もXの呟きなどを観ていると、同レベルらしく、この歪んだ倫理観、ここまでくると滑稽(=高性能AIを開発者自ら潰す)だ。
生成AI動画に関しては、ちょうど先日(12月18日)、2024年まとめ的な内容でライブ配信を行ない、そのアーカイブが観れるので、興味のある方はご覧いただきたい。
2023年からの進化と合わせ、「Kling AI」や「Hailuo AI」などの商用サービス、「Hunyuan Video」や「LTX Video」などローカル生成環境など、デモを交え1時間ほど喋っている。
考えてみれば、PC Watchには長い間原稿を書いているが、(ネットラジオは大昔やったことあるものの)映像でのライブ配信は今回が初だったりする。今後月1回やるとかやらないとか……。
以上、2024年を思いつくまま書いてみた。この原稿を書き終えれば今年残りは撮影とミーティングのみ。今年も何とか無事に終わりそうだ。
去年と今年で大きく違うのはAI=趣味だったのが、AI=仕事になったことだろうか。もちろん趣味でもやってるものの、その延長線上に原稿も含め開発などがあるため、結局仕事ということになる。おそらく来年もAI三昧になるだろう。
今年AI関連はいろいろな意味で準備期間。来年は(一般向けとしては)実用期に入る。どんな2025年になるのか!?