Dòng Qwen3.5 duy trì độ chính xác gần như không mất mát dưới trọng số 4-bit và định lượng bộ nhớ KV. Về hiệu quả ngữ cảnh dài: Qwen3.5-27B hỗ trợ độ dài ngữ cảnh 800K+ Qwen3.5-35B-A3B vượt quá 1M ngữ cảnh trên GPU tiêu dùng với 32GB VRAM Qwen3.5-122B-A10B hỗ trợ độ dài ngữ cảnh 1M+ trên GPU máy chủ với 80GB VRAM Ngoài ra, chúng tôi đã mã nguồn mở mô hình Qwen3.5-35B-A3B-Base để hỗ trợ tốt hơn cho nghiên cứu và đổi mới. Chúng tôi không thể chờ đợi để xem cộng đồng sẽ xây dựng gì tiếp theo!