Att ha en agentisk VLM-modell, skugga och rendera din 3D-scen är det ultimata motexemplet mot "pixlar är allt du behöver"-gruppen. Realtidsvideo är kraftfullt – det är till och med ett nytt medium. Men explicit 3D är fortfarande väldigt användbart. Dessutom gör den här munken mig hungrig.