Seria Qwen3.5 utrzymuje niemal bezstratną dokładność przy kwantyzacji wag 4-bitowych i pamięci podręcznej KV. Jeśli chodzi o efektywność długiego kontekstu: Qwen3.5-27B obsługuje długość kontekstu 800K+ Qwen3.5-35B-A3B przekracza 1M kontekstu na konsumenckich GPU z 32GB VRAM Qwen3.5-122B-A10B obsługuje długość kontekstu 1M+ na serwerowych GPU z 80GB VRAM Dodatkowo, udostępniliśmy model Qwen3.5-35B-A3B-Base jako open-source, aby lepiej wspierać badania i innowacje. Nie możemy się doczekać, co społeczność zbuduje następnie!