さらばgpt-oss。VRAM 16GBあれば動作し、画像も理解してくれる「Qwen3.5」登場！(3/17)

Qwen3.5-27B(Q3_K_S)で動作中のLM Studio。ロード時の設定は、コンテキスト長100,000、GPU Offload 64、Keep Model in Memory/Try mmap() OFFといった設定で、34.67tok/s、1st token 0.2s