슈퍼브에이아이, 데이터로 AI 도입비용 ‘제로’ 시대 연다

슈퍼브에이아이, 데이터로 AI 도입비용 ‘제로’ 시대 연다
데이터 1억개 중 90만개 선별해 AI 학습...GPU 사용량 확 줄여

"딥시크는 GPU 효율을 끌어올려 AI 모델을 저렴하게 개발한 반면 슈퍼브에이아이는 데이터 라벨링과 큐레이팅 기술로 손쉽게 AI를 구축한다."

슈퍼브에이아이(Superb AI)가 산업 현장에서 비용을 거의 쓰지 않고 인공지능(AI) 시스템을 도입할 수 있는 길을 열고 있다. 그 중심에는 AI 모델 개발의 전 과정을 지원하는 완전관리형 플랫폼 '슈퍼브'와 자체 파운데이션 비전 모델(VFM) '제로'가 있다.

2018년 설립된 슈퍼브에이아이는 '데이터 라벨링' 서비스로 시작해 학습 데이터를 선별하는 '데이터 큐레이트' 기술까지 슈퍼브라는 하나의 플랫폼에 담았다.

슈퍼브 플랫폼을 활용하면 누구나 손쉽게 AI 모델을 만들 수 있다. 그러나 산업 현장의 방대한 데이터를 모두 학습하려면 여전히 큰 비용과 컴퓨팅 자원이 필요하다.

차문수 최고기술책임자(CTO) 겸 공동창업자는 "플랫폼과 더불어 모델까지 제공하면 고객이 훨씬 빠르고 저렴하게 AI를 도입할 수 있을 것이라고 판단했다"고 설명했다. 지난달 공개한 ‘제로’는 그래픽처리장치(GPU) 8장으로 단 7일 만에 개발됐다. 1억개에 달하는 데이터 중 90만개만 선별해 학습에 활용했다.

일반적으로 산업용 비전 모델을 개발하려면 GPU 64~128장이 필요하다. 슈퍼브에이아이는 ‘모든 데이터를 학습하지 않는다’는 제로샷(Zero-Shot) 방식을 택했다. 데이터 경량화와 선별 기법으로 학습 비용과 기간을 크게 줄인 것이다.

슈퍼브에이아이는 AI 시스템 도입의 진입장벽을 낮추는 데 집중하고 있다. 시스템 구축 과정에서 고객 부담 비용을 제로에 가깝게 낮추고 이후 산업별 버티컬 솔루션을 접목해 부가가치를 실현할 때 수익을 올린다.

이처럼 플랫폼부터 모델, 그리고 솔루션까지 하나의 풀스택 포트폴리오로 제공하는 것이 슈퍼브에이아이만의 전략이다. 디일렉과 인터뷰에서 차 CTO는 슈퍼브에이아이의 기술력과 사업 방향을 소개했다.

차문수 최고기술책임자(CTO) 겸 공동창업자 (자료=디일렉)

LLM과 다르게 VFM은 익숙치 않다

"일단 비전 파운데이션 모델(VFM) 자체가 전 세계적으로 많이 없다. 그중에서도 중국의 아이디얼 리서치가 가장 잘한다. 문제는 아이디얼 리서치 모델은 중국인만 사용 가능할 뿐 아니라 대중에 공개되지 않았다는 것이다. 오픈소스로 나온 VFM조차도 소셜미디어, 스트리밍 등 범용적인 모델이다. 실상 VFM은 산업 현장에서 요구하는 경우가 많다. 공정 과정의 불량품 검출 등 실용적으로 쓰인다. 다만 실제 환경에서는 새로운 유형(클래스)의 데이터가 끊임없이 나온다. AI 시스템을 접목하더라도 지속적으로 재학습이 필요하다는 말이다. 제로샷 기법의 VFM이 주류가 된 것이 바로 이런 이유 때문이다"

제로샷 기법이란 무엇인지

"제로샷은 학계에서 상당히 오래된 기법이다. 딥러닝 이론이 나올 때부터 있었다. 그럼에도 제로샷은 아직 주류라고 볼 수 없다. 대부분 비전 모델은 슈퍼바이저(지도학습) 기법으로 개발됐다. 이 방식은 모든 데이터를 가공하고 학습하기 때문에 비효율적이다. 이렇게 방대한 데이터를 학습해도 비전 성능이 기대에 못 미치는 경우도 많다. 글로벌 빅테크 기업들이 슈퍼바이저에서 퓨샷(Few-Shot), 나아가 제로샷을 접목한 것은 결국 시간·비용 절감과 관련 있다. 슈퍼브에이아이 역시 작년부터 제로샷 비전 모델 '제로'를 준비했다"

제로만의 차별점은?

"개발 과정에서 비전 데이터 1억개 정도를 수집했다. 웹, AI 허브에서 가져오거나 자체 구축하는 등 전방위적으로 모았다. 여기서 데이터 압축, 즉 큐레이션 기법을 적용해 1억 장 중 90만 장만 선별했다. 비슷한 데이터를 하나로 묶는 방식이다. 특히 비전 데이터는 주로 비디오 프레임에서 추출되는데 같은 시계열에서는 픽셀 단위의 차이가 거의 없다. 비슷한 이미지가 많으면 학습 시 오버피팅(과적화)이 많이 발생한다. VFM에 사용하는 알고리즘은 시그립, 클립, 퍼셉션 인코더 등 비슷하다. 결국 차이는 데이터 학습 방법에서 나온다"

모델명처럼 실제로 시간과 비용이 제로인지

"API 호출료 등 부가 비용이 있긴 하다. 다만 이 비용은 클라우드 서비스 사업자(CSP)들이 책정한 것이지 슈퍼브에이아이의 가격 정책은 아니다. 아마존웹서비스(AWS) 마켓플레이스에 제로를 등재해놨다. 시간당 5달러에 이용할 수 있다. 보통 AI 모델 사용료는 시간당 15~20달러이다. 제로는 시간도 절약해준다. AI 시스템 도입 시 기술검증(PoC)만 하더라도 꽤 많은 시간이 소요된다. 제로는 PoC에 드는 시간을 최소한 단축한다. 실사용 단계로 바로 들어가 효과를 즉시 확인할 수 있게 한다"

제로가 실제 현장에서도 성능을 보장할 수 있는가?

"제로는 VLM(비전언어모델)과 같이 사용하기 때문에 복잡한 공정에서도 정확하게 작동한다. 객체 탐지는 제로가 담당하고 추론은 VLM이 맡는 구조다. VFM이 사람의 눈이라면 VLM은 뇌다. VLM은 자체 개발하지 않고 GPT, 제미나이, 젬마, 큐원 등 써드파티 모델을 가져와 파인튜닝해서 사용한다"

공장의 컴퓨팅 인프라는 열악하지 않나

"제로의 매개변수는 6억개(0.6B) 정도로 크기가 작은 편이다. 엔비디아 A100·H100 등 고성능 GPU 없이도 엣지 컴퓨팅 환경에서 충분히 작동 가능하다. 아무리 경량형 모델이라도 공장에서 24시간 가동하는 것은 운영 측면에서 쉽지 않다. 슈퍼브에이아이 자체 영상관제 플랫폼이 비디오 애널리틱스 기능을 제공해 특정 영상구간만 추출하는 등 운영에 도움을 준다"

시스템 구축에 그치지 않고 솔루션으로 나아가는 방법은?

"슈퍼브에이아이의 접근법은 경쟁사와 뚜렷이 다르다. 대부분의 업체가 산업별 버티컬 솔루션을 먼저 적용한 뒤 플랫폼을 연계하는 데 반해 슈퍼브에이아이는 플랫폼 구축을 최우선으로 한다. 데이터 라벨링, 큐레이션, 파인튜닝 등 다양한 기능이 기본에 깔려 있어 모델을 최적화한 다음 시스템을 도입한다. 기업마다 필요한 AI 솔루션이 제각각이다. 획일적인 제품을 내놓기는 어렵다. 결국 플랫폼을 먼저 갖춰야 다양한 수요에 신속히 대응할 수 있다"

주로 어떤 버티컬 솔루션을 제공하는지

"보안관제, 물류관리, 공정관리 3가지 솔루션에 집중한다. 주로 고객은 시설과 공장에 대량 설치된 CCTV로 AI 시스템을 구축하고자 한다. 30~40개의 산업 분야에서 버티컬 솔루션을 내놓고 있다. 점차 솔루션 적용 범위를 확장할 것이다. 최근 해외에 공장을 짓는 국내 대기업들이 스마트 팩토리를 구현하기 위해 문의가 오고 있다. 이 경우 CCTV 등 하드웨어에 탑재한 채로 판매하려고 한다. 한화와 두산 등 벤더와 협업하고 있다. 삼성SDS, NHN클라우드, AWS 등 클라우드에서 쉽게 이용할 수도 있다. 또는 TD시넥스 같은 시스템통합(SI) 업체를 통해 구축하기도 한다"