Ter um modelo VLM agente, sombrear e renderizar sua cena 3D é o melhor contraponto para o grupo de "pixels é tudo o que você precisa". Vídeo em tempo real é poderoso – é até um meio novo. Mas o 3D explícito ainda é muito útil. Além disso, esse donut me deixa com fome.