Google DeepMind aduce roboţilor gândire multi-pas şi acces la web prin noile modele Gemini

Scris de:
Paul Gabriel Rogojină

Publicat:
26 Septembrie 2025

Categorie:
Tehnologie

Google DeepMind aduce roboţilor gândire multi-pas şi acces la web prin noile modele Gemini

Google DeepMind a anunţat că noile sale modele de inteligenţă artificială permit roboţilor să îndeplinească sarcini mult mai complexe şi chiar să consulte informaţii de pe internet pentru a lua decizii. Într-un briefing de presă, Carolina Parada, şefa diviziei de robotică, a explicat că modelele actualizate lucrează împreună pentru a permite roboţilor să „gândească mai mulţi paşi înainte” înainte de a acţiona în lumea fizică.
Sistemul este bazat pe Gemini Robotics 1.5 şi pe noul model de raţionament aplicat roboticii, Gemini Robotics-ER 1.5, ambele versiuni evoluate ale modelelor lansate în martie. Dacă anterior roboţii executau doar instrucţiuni simple — cum ar fi plierea unei foi de hârtie sau deschiderea unui fermoar — acum pot îndeplini sarcini mai elaborate: sortarea rufelor după culori, împachetarea unei valize în funcţie de vremea din Londra sau separarea gunoiului, compostului şi materialelor reciclabile în acord cu reglementările locale obţinute printr-o căutare web.
Actualizările permit roboţilor să îşi construiască o reprezentare a mediului prin Gemini Robotics-ER 1.5 şi să folosească instrumente digitale, precum Google Search, pentru informaţii suplimentare. Aceste date sunt apoi convertite în instrucţiuni în limbaj natural pentru Gemini Robotics 1.5, care utilizează viziunea computerizată şi procesarea limbajului pentru a executa fiecare etapă.
O noutate majoră este şi capacitatea de „transfer al învăţării”: abilităţile dobândite de un robot pot fi aplicate pe un alt model, chiar dacă acesta are o configuraţie diferită. Google DeepMind a demonstrat că sarcini învăţate de robotul ALOHA2 cu două braţe mecanice funcţionează fără ajustări şi pe robotul Franka sau pe humanoidul Apollo al companiei Apptronik.
Ca parte a lansării, Gemini Robotics-ER 1.5 este pus la dispoziţia dezvoltatorilor prin Gemini API în Google AI Studio, în timp ce accesul la Gemini Robotics 1.5 rămâne limitat la parteneri selectaţi.

Tag-uri:

Articole înrudite

Patroni din construcţii de la Galaţi prinşi cu muncitori “la negru”

Informatii CFR	- 0236 460643
Rezervari CFR	- 0236 496000
Distrigaz	- 0236 460206 / 419
Informatii Romtelecom	- 118 932
SOS - Victimele violentei in familie	- 1983

Salvarea	- 112
Pompieri	- 112
Politie	- 112
Spitalul Clinic de Urgenta	- 0236 301111 / 2 - 0236 411000
Spitalul de Psihiatrie	- 0236 479401
Spitalul de Boli Infectioase	- 0236 334022 / 32
Spitalul de copii	- 0236 469100
Maternitatea (Buna Vestire)	- 0236 413131

Flux de Stiri

Fonduri europene

Google DeepMind aduce roboţilor gândire multi-pas şi acces la web prin noile modele Gemini

Tag-uri:

Articole înrudite

Mica Publicitate