A série Qwen3.5 mantém precisão quase sem perdas sob peso de 4 bits e quantização de cache KV. Em termos de eficiência em contexto longo: Qwen3.5-27B suporta 800K+ de comprimento de contexto Qwen3.5-35B-A3B ultrapassa 1M de contexto em GPUs de consumo com 32GB de VRAM Qwen3.5-122B-A10B suporta 1M+ de comprimento de contexto em GPUs de nível servidor com 80GB de VRAM Além disso, disponibilizamos o modelo Qwen3.5-35B-A3B-Base para apoiar melhor a pesquisa e inovação. Estamos ansiosos para ver o que a comunidade vai construir a seguir!