擁有一個具代理性的 VLM 模型,陰影和渲染你的 3D 場景是對「像素就是你所需要的一切」這一觀點的終極反例。 實時視頻是強大的——它甚至是一種新媒介。但明確的 3D 仍然非常有用。此外,這個甜甜圈讓我感到餓。