La serie Qwen3.5 mantiene un'accuratezza quasi senza perdite sotto quantizzazione a 4 bit per pesi e cache KV. In termini di efficienza del contesto lungo: Qwen3.5-27B supporta una lunghezza di contesto di oltre 800K Qwen3.5-35B-A3B supera 1M di contesto su GPU di livello consumer con 32GB di VRAM Qwen3.5-122B-A10B supporta una lunghezza di contesto di oltre 1M su GPU di livello server con 80GB di VRAM Inoltre, abbiamo reso open source il modello Qwen3.5-35B-A3B-Base per supportare meglio la ricerca e l'innovazione. Non vediamo l'ora di vedere cosa costruirà la comunità dopo!