La serie Qwen3.5 mantiene una precisión casi sin pérdidas bajo peso de 4 bits y cuantización de caché KV. En términos de eficiencia a largo plazo: Qwen3.5-27B soporta 800K+ longitud de contexto Qwen3.5-35B-A3B supera el 1M de contexto en GPUs de consumo con 32GB de VRAM Qwen3.5-122B-A10B soporta 1M+ de longitud de contexto en GPUs de nivel servidor con 80GB de VRAM Además, hemos abierto el modelo Qwen3.5-35B-A3B-Base para apoyar mejor la investigación y la innovación. ¡Estamos deseando ver qué construye la comunidad a continuación!