보도자료

차문수 슈퍼브에이아이 CTO "원스톱 솔루션에서 능동적인 AI로 진화...'에이전틱 비전 AI' 구현할 것"

SUPERB AI

Feb 15, 2025 • 8 min read

차문수 슈퍼브에이아이 CTO가 기술 개발 상황을 설명하고 있다. (사진=슈퍼브에이아이)

"멀티모달과 버티컬 AI, 에이전트는 다른 기술처럼 보이지만, 사실은 하나의 '연결체'입니다. 여기에 기업은 이제 '능동적인 AI'를 원하고 있습니다. 슈퍼브에이아이는 이를 해결하기 위한 넥스트 스테이지로 나가고 있습니다."

차문수 CTO는 지난 2018년 설립 이후 슈퍼브에이아이가 국내 산업용 비전 인공지능(AI) 분야의 선두를 지켰던 이유로 '원스톱 플랫폼 제공'이라는 점을 들었다.

원래 이 회사는 초창기에 데이터 처리, 즉 라벨링으로 국내는 물론 해외에서도 유명했다. 그러나 현장에서 접촉한 기업들이 수요와 인력, 전문성 등이 모두 다르고, 기술에 대해 어려움을 겪는다는 것을 확인했다. 그레서 데이터 처리는 물론, AI 모델과 구축과 서비스 배포, 운영까지 모든 것을 처리할 수 있는 플랫폼을 내놓았다. 바로 '슈퍼브 플랫폼'이다.

이를 통해 빠른 시일내 비전 AI를 국내에 적용할 수 있었다는 설명이다. 이는 일본에서도 마찬가지였는데, 지난해 5월부터 슈퍼브 플랫폼을 채택한 토요타 관계자도 "일본 시장에는 아직 모든 ML옵스 기능을 한데 모은 플랫폼이 존재하지 않기 때문에 현지에서 좋은 반응을 얻고 있다"라고 밝혔다.

이처럼 차문수 CTO는 "현재의 '비전 AI 도입 올인원 플랫폼'으로 거듭날 수 있었던 이유는 고객사의 수요 및 소통을 기반으로 한발 더 앞서서 기술을 개발해 왔기 때문"이라고 밝혔다.

역시 현장 수요를 기반으로, 이제는 다음 단계로 기술 고도화를 진행 중이라고 밝혔다. 그는 "AI가 본격 도입되고 실질적인 업무 효율 향상으로 이어지며, 이제 기업은 보다 '능동적인 AI'를 원하고 있다"라고 말했다.

능동적인 AI란 '입력-AI-출력' 구조에서 한발 나아가, '출력' 이후의 무언가를 제공한다는 것이다.

보안 및 관제를 예로 들었다. 최근 중대재해 처벌 등에 관한 법률이 강화되며 단순히 카메라의 객체 탐지를 넘어, '상황 분석 및 인사이트 도출'이 필수적인 요소로 자리 잡았다는 말이다.

특정 장소나 특정 시간에 사건 발생률이 높아진다는 식의 통계를 AI가 도출해 주는 방식이다. 이처럼 사전 조치와 예방, 인명피해 방지 등에 유용한 정보를 전달하는 것이 중요해졌다. 슈퍼브에이아이의 기술 목표도 '사람을 대체하는' 것이 아니라, 이처럼 '사람이 하지 못하던 영역'을 보완하는 개념으로 나아가는 것이다.

차 CTO는 "능동적인 AI를 위해서는 멀티모달-버티컬 AI-에이전트의 구조를 갖춰야 한다"라고 말했다.

멀티모달과 버티컬 AI, 에이전트 등은 최근 AI 업계의 화두이지만, 개별적인 기술로 인식되는 경우가 많다고 지적했다. "에이전틱(Agentic) 비전 AI를 위해서는 세 부분이 일맥상통하게 이어져야 한다"라고 말했다.

우선, 멀티모달이 중요한 이유는 데이터가 여러 부분에서 발생하기 때문이다.

비전 AI를 제대로 구축하기 위해서는 CCTV를 통한 이미지와 영상뿐 아니라. 센서값이나 텍스트, 음성 등 다양한 데이터를 처리해야 한다. 자율주행이 이런 데이터의 다양성이 극대화되는 분야로 꼽았다. 카메라, 레이더, 라이다(LiDAR), 음성, 로그 등 수집하는 데이터가 무궁무진하다. 로봇도 센서값부터 위치 정보까지 형태가 다양한데, 이를 읽기 위해서는 멀티모달 기능이 필수적이다.

특정 도메인에 대한 전문성을 의미하는 버티칼 AI를 설명하기 위해 ‘의료용 CT 사진'을 예로 들었다. 사진 한장을 통해 일반인이 취득할 수 있는 정보의 양과 전문가의 정보는 완전히 다르다는 것이다. 결국 정보는 '생각하고 찾아내는 만큼' 보일 수 있다는 것으로, 이를 분야별로 적용하기 위해서는 버티컬 AI를 필수로 꼽았다.

마지막으로 에이전트는 이 모두를 아우르는 시스템으로 작용한다. 최근 구글은 에이전트의 구조를 '목표 설정-환경 관찰-스스로 판단'으로 정의한 바 있다. 즉, 매번 목표를 주입하지 않아도, AI가 수집하는 데이터를 기반으로 인사이트를 도출할 수 있어야 한다는 의미다.

구체적으로는 ▲제로샷 기반 '객체탐지' 파운데이션 모델 ▲비디오 애널리틱스 솔루션 ▲카메라 기반 3D 공간 맵핑 '디지털트윈' 고도화 등에 나섰다고 소개했다.

제로샷 모델은 다이내믹하게 변하는 현장 상황에 원활하게 대응하기 위한 것이다. 물류 현장을 예로 들면, 기존 비전 AI는 부품 생김새나 크기가 조금만 달라져도 이를 인지하지 못하는 경우가 대부분이었다. 이에 따라 시간과 비용이 많이 들어갔던 것은 당연하다.

따라서 슈퍼브에이아이는 "제로샷 기반으로 객체 탐지가 가능한 비전언어모델(VLM)의 일종으로, 한 단계 발전한 파운데이션 디텍션 모델을 개발하고 있다"라고 전했다. 시각 정보에 언어 개념까지 더해, 새로운 물체를 마주했을 때 기존 개념과 매칭할 수 있는 모델이라는 설명이다. 즉, 스스로 학습이 가능한 제로샷 모델이다.

차 CTO는 "하지만 이런 기능을 모두 갖춰도, 일부 카메라에만 의존하면 정보 관리가 한정적일 수 있다"라며 "비전 AI는 결국 3D 공간 맵핑, 즉 디지털트윈으로 나갈 수밖에 없다"라고 강조했다. 이를 통해 현장을 구조화하고 인사이트까지 도출할 수 있다고 전했다.

차세대 사업 진출 분야로는 국방을 주시 중이라고 전했다. 슈퍼브에이아이가 최근 엣지 AI 배포를 강화하는 이유도 국방과 제조, 물류 등에서 수요가 증가하기 때문이다.

특히 국방은 보안 문제로 클라우드 이용이 어렵기 때문에, 엣지 기능 강화를 위해 국내 NPU 기업과도 협업을 논의 중이라고 덧붙였다.

여기에 "대부분 비전 AI 모델은 하드웨어 적용 후 1~2년마다 업데이트를 진행하는 것이 일반적"이라며 지속적인 업데이트나 즉각적인 대처가 가능한 슈퍼브에이아이가 강점을 지니고 있다는 점도 강조했다.

마지막으로 그는 "이제는 AI가 미래 기술이 아닌, 수익으로 연결해야 시점"이라며 "올해는 AI로 기업 비용을 줄이고 수익을 올릴 수 있다는 것을 증명하는 데 집중하겠다"라고 강조했다. 슈퍼브에이아이 역시 2026년 기업공개(IPO)를 목표로 하고 있다.

원문은 [매체]에서 확인할 수 있습니다.

흥미로운 AI 인사이트, 놓치지 말고 메일함에서 받아보세요!