Gate News Nachrichten, am 17. März veröffentlicht das Apple AI-Forschungsteam eine Arbeit auf der ICLR 2026, in der die 3D-Generierungsmethode LiTo (Oberflächenlichtfeld-Tokenisierung) vorgestellt wird. Diese kann aus einem einzelnen Bild vollständige 3D-Objekte erzeugen und dabei die Konsistenz von Licht- und Schatteneffekten wie Spiegelglanz und Fresnel-Reflexion beim Perspektivwechsel bewahren. Bisher konnten die meisten 3D-Rekonstruktionsmethoden nur entweder die Geometrie oder das diffuse Aussehen verarbeiten, was die Wiedergabe von lichtabhängigen Details bei Blickwinkeländerungen erschwerte. LiTo kodiert Geometrie und perspektivabhängiges Aussehen in denselben 3D-Latentraum und generiert Ergebnisse durch ein latentes Fluss-Matching-Modell bei nur einem Eingabebild. Das Trainingsset besteht aus Tausenden von 3D-Objekten, die aus 150 Blickwinkeln und drei Beleuchtungsbedingungen gerendert wurden. Der Decoder lernt die vollständige Geometrie und das Aussehen durch zufälliges Sampling. Experimente zeigen, dass LiTo sowohl in der visuellen Qualität als auch bei der Wiedergabe des Eingabebildes TRELLIS übertrifft. Die Arbeit wurde von Jen-Hao Rick Chang, Xiaoming Zhao (gemeinsame Erstautoren), Dorian Chan und Oncel Tuzel verfasst und ist auf arXiv öffentlich zugänglich.