보고·듣고·맡는 AI… 산업 현장서 인간 오감 영역 넘어선다

슈퍼브에이아이는 인간의 '보고-이해하고-행동하는' 과정을 모방한 피지컬 AI 시대를 선도하고 있습니다. 산업용 비전 파운데이션 모델 '제로(ZERO)'를 통해 코딩 없이도 텍스트나 예시 이미지만으로 작업을 수행하는 제로샷 능력을 구현하며, 산업 현장의 AI 도입 장벽을 낮추는 데 기여했습니다.

보고·듣고·맡는 AI… 산업 현장서 인간 오감 영역 넘어선다
감각 정보를 AI로 구현하는 기술이 제조 현장과 안전 분야에서 사용되고 있다. / 챗GPT 생성 (출처 : IT조선)

인공지능(AI)이 단순히 데이터를 분석하는 수준을 넘어 인간의 오감을 모방하며 실제 세계와 상호작용하는 '피지컬 AI' 시대가 본격화되고 있다. 시각, 청각, 후각 등 감각 정보를 AI로 구현하는 기술이 제조 현장과 안전 분야에서 실질적 성과를 내며 산업 전반의 디지털 전환을 이끌고 있다.

보는 AI, VLA 모델로 스스로 판단하고 행동


피지컬 AI의 핵심 기술로 시각-언어-행동(VLA) 모델이 부상하고 있다. VLA는 시각 정보를 인식하고 언어로 해석한 뒤 적절한 물리적 행동을 실행하는 AI다. 인간의 '보고-이해하고-행동하는' 과정을 모방한다. 정해진 규칙만 따라 움직이는 로봇과 달리, 스스로 상황을 판단하고 대응할 수 있는 형태로 진화하고 있다.

비전 AI 올인원 솔루션 기업 슈퍼브에이아이는 산업용 비전 파운데이션 모델 '제로(ZERO)'를 개발하며 관련 기술을 고도화하고 있다. 제로는 코딩 지식 없이 텍스트나 예시 이미지만으로 원하는 작업을 수행하는 '제로샷' 능력을 갖춰 산업 현장의 AI 도입 장벽을 낮추고 있다.

다만 VLA 모델은 '시뮬레이션-현실 간 격차' 문제와 높은 연산 부하로 인한 실시간 작동 한계가 존재한다. 업계는 향후 경량화와 효율성에 초점을 맞춘 설계가 중요해질 것으로 전망하고 있다.

(중략)

인간의 오감을 모방하는 피지컬 AI 기술은 제조 품질 관리, 안전 관리, 산업 자동화 등 다양한 분야에서 실질적 성과를 내며 차세대 산업 혁신의 핵심 동력으로 자리잡고 있다.