Qwen3.5-35B-A3B(Q4_K_M)で動作中のLM Studio。画像解析。ロード時の設定は、コンテキスト長20,000、GPU Offload 30、Keep Model in Memory/Try mmap() OFFで24.36tok/s、1st token 9.24s

Qwen3.5-35B-A3B(Q4_K_M)で動作中のLM Studio。画像解析。ロード時の設定は、コンテキスト長20,000、GPU Offload 30、Keep Model in Memory/Try mmap() OFFで24.36tok/s、1st token 9.24s