Серия Qwen3.5 поддерживает почти безупречную точность при квантовании веса 4 бита и кэша KV. Что касается эффективности длинного контекста: Qwen3.5-27B поддерживает длину контекста более 800K Qwen3.5-35B-A3B превышает 1M контекста на потребительских GPU с 32 ГБ VRAM Qwen3.5-122B-A10B поддерживает длину контекста более 1M на серверных GPU с 80 ГБ VRAM Кроме того, мы открыли исходный код модели Qwen3.5-35B-A3B-Base, чтобы лучше поддерживать исследования и инновации. Мы не можем дождаться, чтобы увидеть, что сообщество создаст дальше!