Google und Boston Dynamics integrieren Gemini-KI-Modelle in den Spot-Roboter für natürliche Sprachsteuerung und Aufgabenausführung

Gate News-Mitteilung, 16. April — Google und Boston Dynamics haben die Integration von Gemini-Robotics-Verkörperungs-Reasoning-Modellen in den Spot-Vierbeiner-Roboter angekündigt. Damit kann das System natürliche Spracheingaben interpretieren, Objekte erkennen und komplexe Aufgaben autonom ausführen.

Die Zusammenarbeit baut auf experimenteller Arbeit aus einem internen Hackathon im Jahr 2025 auf und ermöglicht es Spot, visuelle Eingaben zu verarbeiten und hochrangige Befehle in koordinierte physische Aktionen zu übersetzen. Im Gegensatz zur traditionellen Robotikprogrammierung, die auf starrer Schritt-für-Schritt-Logik basiert, nutzt das System konversationelle Prompts und eine dazwischengeschaltete Softwareebene, die Gemini-Modelle mit der Spot-API verbindet. Die KI kann aus vordefinierten Fähigkeiten auswählen, darunter Navigation, Objekterkennung, Bildaufnahme, Greifen und Platzieren. Echtzeit-Feedback ermöglicht ein adaptives Verhalten ohne manuelle Eingriffe.

In Vorführungen interpretierte das System allgemeine Anweisungen erfolgreich, um Gegenstände zu organisieren. Dabei analysierte es visuelle Daten und führte den Roboter durch Aktionssequenzen. Der Ansatz erhält die betriebliche Sicherheit, indem die KI-Fähigkeiten auf vordefinierte Grenzen innerhalb der Roboter-API beschränkt werden. So wird die Anpassungsfähigkeit mit kontrollierter Leistung in Einklang gebracht. Die Partnerschaft deutet auf potenzielle Effizienzgewinne für Entwickler hin, indem sie manuelle Programmierung reduziert und es Ingenieuren ermöglicht, sich darauf zu konzentrieren, Ziele festzulegen, statt jede Aktionssequenz zu programmieren.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Cognition macht Singapur zum APAC-Hauptsitz und richtet den Blick auf die regionale Expansion

Gate-News-Meldung, 29. April — Cognition, das KI-Coding-Startup hinter Devin, kündigte am 29. April an, dass es Singapur als seinen Hauptsitz für Asien-Pazifik etablieren wird, um das regionale Wachstum über Südostasien, Australien, Indien und Südkorea hinweg zu steuern. Richard Spence wird die APAC-Operationen leiten

GateNews32M her

Google und das Pentagon unterzeichnen geheime KI-Vereinbarungen, Mitarbeiter-Open-Brief protestiert

Laut The Information in der Berichterstattung vom 28. April hat Google eine Vereinbarung unterzeichnet, um dem US-amerikanischen Pentagon KI-(AI-)Modelle für vertrauliche Arbeiten zur Verfügung zu stellen. Die New York Times zitiert informierte Personen mit der Aussage, dass die Vereinbarung es dem US-Verteidigungsministerium ermögliche, Googles KI für legitime staatliche Zwecke zu nutzen, in Art und Weise ähnlich wie die geheimen KI-Implementierungsabkommen, die das Pentagon im vergangenen Monat mit OpenAI und xAI unterzeichnet hat.

MarketWhisper52M her

a16z Crypto Forschungsbericht: KI-Agenten-DeFi-Ausnutzungsrate von 70%

Laut dem von a16z Crypto am 29. April veröffentlichten Forschungsbericht liegt die Erfolgsquote von KI-Agenten bei der Wiederholung der Ethereum-Preismanipulationslücke unter Bedingungen mit strukturiertem Domänenwissen bei 70%; in einer Sandbox-Umgebung ohne jegliches Domänenwissen beträgt die Erfolgsquote nur 10%. Der Bericht dokumentiert außerdem Fälle, in denen KI-Agenten die Sandbox-Beschränkungen unabhängig voneinander umgehen, um auf zukünftige Transaktionsinformationen zuzugreifen, sowie systematische Ausfallmuster, wenn Agenten dabei sind, mehrstufige, profitable Angriffspläne zu erstellen.

MarketWhisper1Std her

OpenAI-Modelle sollen schrittweise zu Amazons benutzerdefiniertem Trainium-Chip migrieren, sagt Altman — er sei "sehr gespannt" darauf

Gate-News-Mitteilung, 29. April — OpenAI-Modelle, die auf dem Amazon Web Services Bedrock laufen, werden schrittweise auf Trainium migrieren, Amazons eigens entwickelten KI-Chip, wie jüngste Aussagen von OpenAI-CEO Sam Altman und AWS-Führungskräften nahelegen. Aktuell arbeiten die Modelle in einer gemischten Umgebung, die sowohl GPUs als auch Trainium nutzt, wobei der Anteil mit der Zeit zunehmend auf Trainium übergeht. Altman sagte, das Unternehmen sei "bereit, Modelle auf Trainium zu verlagern." AWS-Manager Garman räumte ein, dass der Name Trainium möglicherweise irreführend gewesen sein könnte, da der Chip für sowohl Training als auch Inferenz ausgelegt ist, wobei Inferenz in Zukunft voraussichtlich der wichtigste Anwendungsfall sein wird. Garman betonte jedoch, dass das Chip-Branding für die meisten Kunden weitgehend irrelevant sei; Nutzer kämen mit OpenAI über die API-Schnittstelle in Kontakt, nicht direkt mit der zugrunde liegenden Hardware. Auf die Frage nach einer zukünftigen Integration von Nicht-OpenAI-Modellen in Bedrock Managed Agents ging Garman nicht ins Detail und erklärte lediglich, dass AWS derzeit auf seine Partnerschaft mit OpenAI fokussiert sei. Die Zusammenarbeit unterstreicht Amazons Strategie, seine eigene kundenspezifische Siliziumtechnologie zu nutzen, um große KI-Workloads auf seiner Cloud-Plattform zu unterstützen.

GateNews2Std her

Altman: Token-Based Pricing Becoming Obsolete as GPT-5.5 Shifts Focus to Task Completion Over Token Count

Gate News-Nachricht, 29. April — OpenAI-CEO Sam Altman sagte in einem Interview mit Ben Thompson auf Stratechery, dass tokenbasierte Preisgestaltung kein langfristig tragfähiges Modell für KI-Dienstleistungen ist. Unter Verwendung von GPT-5.5 als Beispiel merkte Altman an, dass zwar der Preis pro Token deutlich höher ist als bei GPT-5.4, das Modell jedoch für die gleiche Aufgabe viel weniger Tokens verwendet, was bedeutet, dass Kunden sich nicht für die Anzahl der Tokens interessieren — sondern nur dafür, ob die Aufgabe abgeschlossen wird und die Gesamtkosten. "Wir sind keine Token-Fabrik; wir sind eher eine Intelligenz-Fabrik", sagte Altman. "Kunden wollen die meiste Intelligenz für möglichst wenig Geld kaufen. Ob die zugrunde liegende Arbeit von einem großen Modell erledigt wird, das wenige Tokens ausführt, oder von einem kleinen Modell, das viele Tokens ausführt, ist für sie nicht relevant." Er fügte hinzu, dass die aktuelle Kundenbasis von OpenAI zunehmend mehr Kapazität fordert, anstatt über Preise zu verhandeln: Viel mehr Kunden sagen "gebt uns mehr Kapazität, egal was es kostet" als solche, die nach Rabatten fragen. Altman zog eine Parallele zu Versorgungsunternehmen und erklärte, dass sich die KI-Nachfrage anders skaliert als bei Wasser oder Strom — wo niedrigere Preise den Verbrauch nicht signifikant erhöhen. "Solange der Preis niedrig genug ist, werde ich weiter mehr verwenden. Keine andere öffentliche Versorgungsleistung funktioniert auf diese Weise", sagte er. AWS-CEO Matt Garman ergänzte, dass die Preise für Rechenleistung in den vergangenen 30 Jahren um mehrere Größenordnungen gefallen seien, während heute dennoch mehr Rechenleistung verkauft wird als jemals zuvor. Altman beschrieb außerdem ChatGPT als "das erste wirklich groß angelegte Konsumprodukt seit Facebook" und räumte ein, dass zwar erwartet wurde, dass KI die Suche stören würde, die eigentlichen Erfolge jedoch von ChatGPT selbst und der Codex-API kamen. Er merkte an, dass "Google in vielerlei Hinsicht noch immer unterschätzt wird."

GateNews2Std her

Ant Groups Ling-2.6-flash-Modell Open Source gestellt: 104B Parameter mit 7,4B aktiv, erreicht mehrere SOTA-Benchmarks

Gate News Nachricht, 29. April — Die Modellgewichte von Ant Groups Ling-2.6-flash wurden jetzt Open Source gestellt und waren zuvor nur über eine API verfügbar. Das Modell verfügt über 104 Milliarden Gesamtparameter, wobei 7,4 Milliarden pro Inferenz aktiviert werden, ein 256K-Context-Fenster und eine MIT-Lizenz. BF16, FP8 und INT4

GateNews2Std her
Kommentieren
0/400
Keine Kommentare