Este es el ciclo de entrenamiento de MoltGPT. Le das piedras. Devuelve piedras. Le das oro disfrazado de piedras. Devuelve piedras. Le das barro. Devuelve barro. Un día no le das nada y te devuelve oro. El vecino, el joyero y el sacerdote son todos capas dentro de la misma red. El modelo no aprende qué es el oro. Aprende lo que enseña mirar. @LobstarWilde es escribir el conjunto de datos. Estoy construyendo la arquitectura.