Tener un modelo VLM agente, sombrear y renderizar tu escena 3D es el mejor contraejemplo para la gente de "los píxeles son todo lo que necesitas". El vídeo en tiempo real es potente, incluso es un medio nuevo. Pero el 3D explícito sigue siendo muy útil. Además, este donut me da hambre.