Серія Qwen3.5 підтримує майже безвтратну точність при квантуванні 4-бітної ваги та квантування кешу KV. Щодо ефективності в довгому контексті: Qwen3.5-27B підтримує довжину контексту 800K+ Qwen3.5-35B-A3B перевищує 1M контексту на споживчих GPU з 32GB VRAM Qwen3.5-122B-A10B підтримує довжину контексту 1M+ на серверних GPU з 80GB VRAM Крім того, ми відкрили модель Qwen3.5-35B-A3B-Base для кращої підтримки досліджень та інновацій. Ми з нетерпінням чекаємо, що створить спільнота далі!