Parabéns à equipa @liquidai pelo LFM2-24B-A2B! 🎉 Suporte no dia 0 para LFM2-24B-A2B na versão estável do vLLM ✅ 24B de parâmetros totais, apenas 2B ativos por token — cabe em 32 GB de RAM e atinge 293 tok/s no H100 🔥