NVIDIA zeigt Roboter, die unbekannte Werkzeuge greifen können

Nvidias Forschung zielt auf den naechsten Greifarm, das sicherere Auto und das Training von KI-Agenten

Ein Blogpost aus Nvidias Forschungsabteilung skizziert, woran das Unternehmen bei Robotik, autonomem Fahren und Agenten-Training arbeitet - mit wenig konkreten Details.

Ein Roboter, der genau einen Gegenstand greifen kann, ist eine Demo. Ein Roboter, der auch den naechsten Gegenstand greift, und den uebernaechsten, und das mit einem Werkzeug, das er noch nie in der Hand hatte - das ist ein Produkt. Mit dieser Unterscheidung eroeffnet Nvidia einen aktuellen Forschungsbeitrag und macht damit ziemlich klar, woran es in der Robotik bisher hakt: an der Verallgemeinerung. Genau hier will der Chiphersteller laut eigener Darstellung ansetzen, gemeinsam mit Fortschritten beim autonomen Fahren und beim Training von KI-Agenten in grossem Massstab.

Veroeffentlicht wurde der Beitrag unter dem Titel "NVIDIA Research Unlocks Advanced Grasping, Smarter Autonomous Driving and Agent Training at Scale" im Nvidia-Blog. Er nennt drei Arbeitsfelder der hauseigenen Forschungsabteilung: fortgeschrittenes Greifen bei Robotern, intelligenteres autonomes Fahren und das Training von KI-Agenten (Software, die selbststaendig Aufgaben in mehreren Schritten loest) in grossem Massstab. Welche konkreten Modelle, Datensaetze oder Benchmarks (standardisierte Tests, an denen man KI-Systeme misst) dahinterstehen, ist im hier vorliegenden Material nicht ausgefuehrt - der zitierte Abschnitt bricht nach der Einleitung ab.

Die Stossrichtung passt zu Nvidias strategischer Lage. Das Unternehmen verdient sein Geld bisher vor allem mit Chips fuer das Training grosser Sprachmodelle, sucht aber sichtbar nach dem naechsten grossen Anwendungsfeld. Robotik und autonomes Fahren sind beides Bereiche, in denen viele Wettbewerber seit Jahren ringen - vom Industrierobotik-Spezialisten bis zum Autohersteller mit eigener KI-Abteilung. Wenn Nvidia hier Grundlagenforschung sichtbar macht, signalisiert das den eigenen Kunden und Partnern: Wir liefern nicht nur die Hardware, wir denken auch ueber die Modelle nach, die darauf laufen sollen. Fuer Entwickler in diesen Feldern duerfte interessant sein, ob aus den Forschungsarbeiten am Ende offene Werkzeuge oder eher proprietaere Komponenten werden.

Was im vorliegenden Material nicht steht, ist mindestens so wichtig wie das, was drinsteht. Es bleibt offen, ob es sich um neue veroeffentlichte Paper, um Produktankuendigungen oder um eine Sammelnotiz zu bereits bekannter Arbeit handelt. Auch zu den drei Themen Greifen, autonomes Fahren und Agenten-Training fehlen Details: keine Benchmarks, keine Vergleichszahlen, keine Hinweise auf Partner oder konkrete Hardware. Damit laesst sich aus dem Hinweis allein nicht ableiten, ob hier ein technischer Durchbruch oder eher ein Marketing-Update vorliegt. Das gehoert sauber gekennzeichnet: Vermutlich verweist der Blogpost auf mehrere Einzelarbeiten, im Material belegt ist das aber nicht.

Wer das Thema weiterverfolgen will, sollte in den kommenden Tagen auf zwei Signale achten: erstens auf begleitende Veroeffentlichungen aus Nvidias Forschungsabteilung, idealerweise mit nachvollziehbaren Tests; zweitens auf Reaktionen aus der Robotik- und Automotive-Branche, die zeigen, ob die angekuendigten Fortschritte dort als ernsthafte Konkurrenz oder als willkommene Vorarbeit wahrgenommen werden.

PROD

Microsoft macht Windows zur KI-Agenten-Plattform

Microsoft hat auf der Build 2026 das Windows Agent Framework als Open Source veröffentlicht. Damit erklärt das Unternehmen Windows zur nativen Plattform für KI-Agenten. Ergänzend wurde Azure Agent Mesh vorgestellt.

Gemma 4 12B: Googles neues multimodales Modell ohne Encoder

Google hat Gemma 4 12B veröffentlicht – ein multimodales Modell, das ohne separaten Encoder auskommt. Es verarbeitet Text und andere Modalitäten in einem einheitlichen Ansatz. Weitere Details zum Modell sind im Material nicht enthalten.

MARKT

Uber zahlt 1.500 Dollar pro Monat für KI-Tools – ein Richtwert?

Uber gibt monatlich bis zu 1.500 US-Dollar pro Mitarbeiter für KI-Tools aus. Dieser Betrag wird im Material als nützliches Signal für die Preisgestaltung von KI-Produkten diskutiert. Genaue Details zur Einordnung sind im Material nicht weiter ausgeführt.

MARKT

DDR5-RAM kostet 375 Dollar – KI-Nachfrage belastet PC-Markt

32 GB DDR5-Arbeitsspeicher kosten aktuell 375 US-Dollar. Der Preisanstieg hängt laut Material mit der anhaltenden KI-Nachfrage zusammen. Das macht den PC-Eigenbau spürbar teurer.

MARKT

Anthropic baut Claude-Partnernetzwerk mit neuem Services-Track aus

Anthropic hat einen Services Track und einen Partner Hub für das Claude Partner Network eingeführt. Damit baut das Unternehmen sein Ökosystem für Unternehmenspartner strukturierter aus. Weitere Inhalte des Programms sind im Material nicht spezifiziert.

SAFE

Anthropic kartiert ein Jahr KI-gestützte Cyberangriffe

Anthropic hat analysiert, wie KI über ein Jahr hinweg bei Cyberangriffen eingesetzt wurde. Die Ergebnisse dieser Bestandsaufnahme wurden veröffentlicht. Konkrete Zahlen oder Angriffsmuster nennt das vorliegende Material nicht.

RES

Stanford-Studie: KI schlägt Jura-Professoren bei juristischen Aufgaben

KI-Systeme haben in einer Stanford-Law-Studie besser abgeschnitten als Rechtsprofessoren. Das Ergebnis sorgt für Diskussionen über den Einsatz von KI in der Rechtspraxis. Details zu Aufgabentypen oder eingesetzten Modellen enthält das Material nicht.

SAFE

Anthropic weitet Projekt Glasswing aus

Anthropic hat bekannt gegeben, das Projekt Glasswing zu erweitern. Was genau hinter dem Projekt steckt und welche Ziele es verfolgt, geht aus dem vorliegenden Material nicht hervor. Unklar bleibt auch, für wen das Angebot gedacht ist.

NVIDIA zeigt Roboter, die unbekannte Werkzeuge greifen können

KI-4-Everyone · Daily News