구글 Gemini Robotics와 엔비디아 Newton: 피지컬 AI 혁신의 최전선

구글의 Gemini Robotics 1.5, 엔비디아의 Newton 물리엔진과 Isaac GR00T 모델 등 피지컬 AI의 최신 동향을 소개합니다. 산업 현장에 특화된 슈퍼브에이아이의 비전 파운데이션 모델 ZERO와 MLOps 플랫폼이 이러한 글로벌 혁신과 어떻게 맞닿아 있는지 살펴봅니다.

NVIDIA

최근 구글과 엔비디아를 필두로 한 글로벌 테크 기업들의 발표는 단순한 신제품 출시를 넘어, ‘피지컬 AI(Physical AI)’ 시대의 본격적인 개막을 알리는 신호탄과 같습니다. 이는 지능을 갖춘 로봇과 자율 시스템의 대량 개발을 위한 핵심 기반이 마련되었음을 의미하며, 피지컬 AI가 일부 연구실을 넘어 산업 지형을 바꿀 거대한 흐름으로 전환되었음을 명확히 보여줍니다.

그렇다면 피지컬 AI란 무엇일까요? 피지컬 AI(체화된 AI, Embodied AI)는 단순히 디지털 공간에 머무는 AI가 아닙니다. 로봇, 드론, 자율주행차와 같이 물리적인 ‘몸’을 가진 시스템이 현실 세계와 직접 상호작용하는 기술을 의미합니다.카메라, LiDAR 같은 센서로 세상을 ‘인식’하고, 고도화된 AI 모델로 ‘추론’하며, 모터나 로봇 팔 같은 액추에이터를 통해 ‘행동’합니다.이 인식-추론-행동의 고리가 끊임없이 순환하며, 기계가 현실 세계의 복잡하고 예측 불가능한 문제들을 해결하게 만듭니다. 

이 새로운 시장의 잠재력은 상상을 초월합니다. 골드만삭스는 휴머노이드 로봇 시장이 2035년까지 380억 달러에 이를 것으로 전망했으며, 모건 스탠리는 2050년에는 5조 달러 규모까지 성장할 수 있다고 예측했습니다. 이는 앞으로 펼쳐질 기술 경쟁의 판돈이 얼마나 막대한지를 보여주는 단적인 예입니다.

구글과 엔비디아의 최근 발표는 직접적인 경쟁이라기보다, 피지컬 AI 생태계를 떠받치는 두 개의 거대한 기둥을 세우는 것에 가깝습니다. 하나는 로봇의 ‘두뇌’를, 다른 하나는 로봇이 배우고 성장할 ‘세계’를 제공합니다.

1. 구글 제미나이 로보틱스: 두 개의 두뇌로 생각하고 행동하는 로봇

구글 딥마인드는 2025년 9월 혁신적인 로봇 AI 모델 Gemini Robotics 1.5를 공개했습니다. 이 시스템은 “두 개의 두뇌”를 사용하는 것이 특징입니다.

첫 번째 두뇌인 Gemini Robotics-ER 1.5는 로봇의 고차원적인 계획 수립과 추론을 담당하는 모델로, 자연어로 상황을 이해하고 필요한 정보를 웹에서 검색하는 등의 역할을 합니다. 예를 들어 “여기 있는 물건들을 지역 규정에 맞게 재활용, 일반쓰레기, 음식쓰레기로 분류해줘”라는 지시를 받으면, 로봇은 ER 1.5 모델을 통해 인터넷에서 해당 지역의 재활용 규정을 찾아보고 주변 물체를 분석하여 계획을 세웁니다.

두 번째 두뇌인 Gemini Robotics 1.5가 이러한 계획을 받아 시각 정보와 지시를 실제 동작으로 변환합니다. VLA(Vision-Language-Action) 모델은 동작에 앞서 내부적으로 생각의 흐름을 자연어로 생성하고, 사람이 이해할 수 있도록 자신의 판단 근거를 설명하기 때문에 로봇의 행동이 한층 투명해졌습니다.

제미나이 로보틱스 1.5의 작동 시스템. 출처

무엇보다도 Gemini Robotics 1.5의 눈에 띄는 성과는 다른 형태의 로봇 간에도 학습한 능력을 공유할 수 있다는 점입니다. 한 종류의 로봇에서 배운 작업을 전혀 다른 로봇에 옮겨도 별도 재학습 없이 동작할 수 있어, 그간 로봇마다 처음부터 새로 모델을 훈련해야 했던 “체화(embodiment) 문제”를 극복했습니다. 예컨대 ALOHA 2 로봇으로 훈련한 작업이 휴머노이드 로봇 Apollo나 이족 로봇 Franka에서도 그대로 수행되는 식입니다.

이러한 크로스 플랫폼 일반화 능력은 로봇 개발 사이클을 크게 단축시켜줄 것으로 기대됩니다. 구글은 Gemini Robotics 1.5를 통해 로봇이 단순 반복작업을 넘어 맥락을 이해하고 도구를 활용하며 스스로 계획을 세우는 단계로 진입했다고 강조합니다. 물리 세계에서의 AGI에 한 걸음 다가선 성과로 평가됩니다

2. 엔비디아 아이작 플랫폼: 로봇을 위한 ‘매트릭스’

엔비디아는 2025년 9월 CoRL 2025 행사에서 로봇 연구를 가속화할 수 있는 일련의 신기술을 발표했습니다. 먼저 Newton이라 명명된 신규 물리 시뮬레이션 엔진을 오픈 소스로 공개했는데, 이 엔진은 디즈니 리서치와 구글 딥마인드와 공동 개발되었으며 NVIDIA Isaac Lab 플랫폼에 통합되었습니다.

이를 통해 눈이나 자갈길 위를 걷는 동작, 물체를 쥐는 세밀한 동작 등 기존 물리엔진으로는 어려웠던 복잡한 로봇 행동도 정밀하게 시뮬레이션할 수 있습니다. 많은 연구기관과 대학(ETH 취리히, 뮌헨 공대, 베이징대 등) 그리고 로봇 기업들이 이미 Newton 엔진을 도입해 현실감 있는 디지털 트윈 환경을 구축하기 시작했습니다.

함께 발표된 Isaac GR00T N1.6은 오픈 소스 로봇 파운데이션 모델로서, 인간 수준의 추론 능력을 로봇에 부여하는 것을 목표로 합니다. 이 모델은 모호한 자연어 지시를 이해하고 상식과 사전 지식을 활용해 복잡한 작업을 단계별로 계획할 수 있으며, 물리적 상황에 대한 추론까지 수행합니다. 예를 들어 “무거운 문 열기”와 같이 기존 로봇에게 막연했던 지시도, GR00T 모델은 맥락을 파악하여 팔과 몸의 균형을 함께 고려한 동작 계획을 세울 수 있습니다.

GR00T N1.6에는 Cosmos Reason이라는 오픈 비전-언어 모델이 통합되어 있는데, 이는 로봇이 새로운 상황을 마주쳤을 때 필요한 정보를 스스로 만들어내거나 대규모 합성 데이터를 생성·주석하여 학습에 활용하도록 돕는 역할을 합니다. 엔비디아는 이러한 로봇 두뇌(GR00T)와 로봇의 몸체(Newton 물리엔진), 그리고 훈련 환경(Omniverse 기반 Isaac Lab)을 모두 공개함으로써, 연구자들이 시뮬레이션에서 학습한 모델을 실세계 로봇에 빠르게 이식할 수 있는 통합 플랫폼을 제공합니다.

또한 엔비디아는 물리적 AI 모델 학습을 가속화하기 위해 Cosmos라고 불리는 월드 파운데이션 모델(WFM)들도 함께 업그레이드했습니다. Cosmos Predict 2.5와 Cosmos Transfer 2.5는 텍스트, 이미지, 비디오 프롬프트로 다양한 가상 데이터를 생성해주는 모델로, 최대 30초 길이의 동영상을 멀티뷰 카메라 시점으로 만들어내거나, 3D 시뮬레이션 장면으로부터 현실감 있는 합성 이미지를 대량 생성하는 기능을 제공합니다.

엔비디아 코스모스 모델 적용 사례

이는 로봇 학습용 데이터 확보의 병목을 해결해, 실제 현장에서 수집하기 힘든 방대한 훈련 데이터를 가상으로 확보할 수 있게 해줍니다. 이처럼 엔비디아의 물리 AI 스택은 시뮬레이션과 AI, 데이터를 아우르며 차세대 자율 로봇 개발의 토대를 마련하고 있습니다.

결론적으로 구글은 보편적인 ‘추론 계층(마음)’을, 엔비디아는 보편적인 ‘물리 및 기술 계층(몸과 세계)’을 구축하며 거대한 시너지를 창출하고 있습니다. 이는 로보틱스 산업 전체의 진입 장벽을 낮추고 혁신을 가속화하는 강력한 플랫폼 전략입니다.

불과 몇 년 전까지만 해도 로봇은 정해진 동작을 반복하는 자동화 기계에 가까웠지만, 이제는 스스로 인지하고 학습하며 사람과 협업할 수 있는 지능형 에이전트로 거듭나고 있습니다. 구글의 Gemini Robotics 1.5가 보여준 자율적 판단과 크로스 플랫폼 학습, 엔비디아의 개방형 시뮬레이션과 로봇 파운데이션 모델은 모두 같은 목표를 향합니다.

바로 현실 세계의 복잡성을 이해하고 대응하는 범용 인공지능, 피지컬 AI의 실현입니다. 이러한 기술 진보는 산업계에도 큰 파장을 일으켜, 생산성과 안전성 향상은 물론이고 새로운 비즈니스 기회를 창출할 것으로 기대됩니다. 동시에 AI 개발 인프라의 중요성을 재확인시켜주고 있습니다. 데이터 확보와 처리, 대규모 모델 학습과 배포까지 엔드투엔드로 지원하는 MLOps 없이는 어느 한 기업이 이 모든 혁신을 빠르게 따라가기 어렵기 때문입니다.

슈퍼브에이아이는 비전 파운데이션 모델 제로와 MLOps 플랫폼 기술로 흐름에 합류하고 있습니다. 로봇의 눈과 뇌, 그리고 가상훈련장이 모두 갖춰진 생태계가 성숙할수록, SF 영화 속 로봇 비서나 스마트 팩토리의 완전한 자율화도 그리 머지않은 미래가 될지 모릅니다. 산업 관계자분들도 이러한 흐름을 주시하며, 자사 업무에 접목할 맞춤형 AI 모델과 인프라 전략을 모색해야 할 시점입니다. 앞으로 펼쳐질 피지컬 AI 시대에는, “생각하며 행동하는 로봇”이 우리의 일상과 산업 현장에서 새로운 동반자가 될 것입니다.

슈퍼브에이아이의 피지컬 AI가 궁금하시다면, 아래 내용을 남겨주세요. 슈퍼브에이아이 전문가들이 바로 연락 드리겠습니다.