Google DeepMind onthult twee nieuwe AI-modellen voor robotica


Key Takeaways

  • Google DeepMind heeft twee nieuwe AI-modellen onthuld die ontworpen zijn om robots verbeterde mogelijkheden te geven in echte omgevingen.
  • Het eerste model, Gemini Robotics, is gebouwd op de basis van Gemini 2.0, Google’s nieuwste grote taalmodel.
  • Gemini Robotics integreert ruimtelijk bewustzijn, interactie en behendigheid in één model.

Google DeepMind heeft twee nieuwe AI-modellen onthuld die ontworpen zijn om robots verbeterde mogelijkheden te geven in echte omgevingen. Het eerste model, Gemini Robotics, is gebouwd op de basis van Gemini 2.0, Google’s nieuwste grote taalmodel. Dankzij deze innovatieve architectuur kan Gemini Robotics verschillende situaties begrijpen, zelfs situaties die buiten de trainingsgegevens vallen.

Carolina Parada, hoofd robotica bij Google DeepMind, benadrukt dat Gemini Robotics gebruik maakt van het multimodale begrip van Gemini 2.0 om deze kennis te vertalen naar tastbare acties in de fysieke wereld. Het model vertoont aanzienlijke vooruitgang op drie cruciale gebieden: ruimtelijk bewustzijn, interactie en behendigheid. Naast het interpreteren van nieuwe scenario’s blinkt Gemini Robotics uit in interactie met mensen en zijn omgeving. Het kan ook precieze fysieke taken uitvoeren, zoals het vouwen van papier of het openen van een fles.

Gemini Robotics-ER

Parada benadrukt dat eerdere ontwikkelingen in de robotica zich richtten op afzonderlijke aspecten, zoals ruimtelijk inzicht, interactie of behendigheid. Gemini Robotics integreert deze mogelijkheden echter in één model. Deze benadering maakt het mogelijk robots te creëren die capabeler, responsiever en veerkrachtiger zijn.

Gemini Robotics wordt aangevuld met Gemini Robotics-ER, een geavanceerd visueel taalmodel dat ontworpen is om de complexiteit van onze dynamische wereld te begrijpen. Dit model is bedoeld voor taken zoals het inpakken van een broodtrommel, waarbij inzicht in de locatie van objecten, openingsmechanismen en de plaatsing van voorwerpen vereist is. Parada legt uit dat Gemini Robotics-ER bedoeld is om dit soort ingewikkelde redeneringen voor robots mogelijk te maken.

Ontwikkelen nieuwe generatie humanoïde robots

Om toepassingen in de echte wereld te verbeteren, is Google DeepMind een partnerschap aangegaan met Apptronik om de volgende generatie humanoïde robots te ontwikkelen. Het bedrijf heeft ook toegang verleend tot zijn Gemini Robotics-ER-model aan betrouwbare testers, waaronder Agile Robots, Boston Dynamics en Enchanted Tools.

Google DeepMind heeft een gelaagde aanpak geïmplementeerd om de veiligheidsproblemen aan te pakken die gepaard gaan met AI-modellen die autonome fysieke acties kunnen uitvoeren. Vikas Sindhwani, een onderzoeker bij Google DeepMind, legt uit dat Gemini Robotics-ER modellen getraind worden om de veiligheid van mogelijke acties binnen specifieke contexten te beoordelen. Het bedrijf promoot ook actief veiligheidsonderzoek in de AI-industrie door middel van nieuwe benchmarks en initiatieven. Vorig jaar introduceerde het bedrijf de Robot Constitution, een reeks leidende principes voor robotgedrag.

Wil je toegang tot alle artikelen, geniet tijdelijk van onze promo en abonneer je hier!

Meer

Ontvang de Business AM nieuwsbrieven

De wereld verandert snel en voor je het weet, hol je achter de feiten aan. Wees mee met verandering, wees mee met Business AM. Schrijf je in op onze nieuwsbrieven en houd de vinger aan de pols.