さらばgpt-oss。VRAM 16GBあれば動作し、画像も理解してくれる「Qwen3.5」登場！(15/17)

LM Studioでの動作。Q4_K_M(7.5GB)で96.58tok/s、0.23s(画像解析で0.84s) 1st tokenと爆速！コンテキスト長はVRAMを溢れない範囲だと50,000