[쫌아는기자들] 슈퍼브에이아이, "일반인이 개발자보다 쓸모있는 AI 모델 만들 수 있다"
슈퍼브에이아이는 듀크대 전자공학과를 나온 김현수 대표가 2018년에 설립했습니다. 듀크대 학사 이후에 같은 대학의 박사 과정에서 인공지능과 로보틱스 분야 연구를 하다가 SK텔레콤의 T브레인의 엔지니어로 왔고, 다시 대기업을 나와서 스타트업을 창업했습니다. 2019년에 와이컴비네이터에 선정됐습니다. 당시 7번째 한국 스타트업이었습니다.
2019년에 시드 25억원, 2021년에 시리즈A 110억원, 2022년에 시리즈B 220억원을 유치했습니다. 인공지능 엔지니어가 없는 기업도 인공지능을 쓸 수 있도록 하겠다는게 이 스타트업의 목표입니다. 법인은 한국, 미국, 일본 3국에 뒀습니다. 고객사에는 삼성, LG전자, 퀄컴, 현대자동차, SK텔레콤, 도요타 등이 있습니다. 2026년 상반기에 상장을 추진합니다.
(중략)
1. 도요타에도 AI 개발자가 없는 부서가 적지 않다
-슈퍼브에이아이의 비즈니스모델이란게 사실 딱 봐선 모르겠네요.
“AI를 개발하는 소프트웨어 플랫폼이에요. 집중 분야는 영상 분야 인공지능입니다. 고객사들이 사진이나 동영상, 라이더 데이터와 같은 시각적인 정보를 기반으로, 뭔가를 인지·분석하는 AI를 직접 잘 만들 수 있도록 하는 툴을 제공합니다. 사실 세상에 AI 개발 툴이 되게 많아요. 대부분은 AI 개발자들을 위한 겁니다. 슈퍼브에이아이는 달라요. AI 개발자가 아닌 분들도 쉽게 AI를 만들 수 있도록 도와야, 산업 현장에 AI가 빠르게 확산되지 않겠어요?”
“예컨대 도요타가 슈퍼브에이아이 고객사예요. 도요타에는 AI 개발자들이 상당히 많이 있는 부서도 있고 없는 부서도 있어요. 자율주행을 개발하는 부서는 AI 개발자들이 굉장히 많겠지만, 제조·물류와 같이 전통 산업에 가까운 쪽에는 사내에 AI 개발자들이 그렇게 많지는 않아요. AI에 대해서 전혀 모르는 산업 현장의 분들도 자기가 필요한 AI를 손쉽게 만들 수 있도록 슈퍼브에이아이 플랫폼을 제공합니다.”
-일반인이 AI를 만든다?
“AI 개발에는 데이터가 제일 중요해요. 근데 데이터는 산업 현장에서 실제로 데이터를 접하는 현장 분들이 가장 잘 알아요. 산업 현장 분들이 만드는게 훨씬 좋은 AI일 수 있는거죠. 실제 도요타 제조 공정 등 여러 분야에서 슈퍼브에이아이 플랫폼을 이용해 직접 AI를 만들어서 쓰고 있어요.”
-일본 도요타가 슈퍼브를 활용해 실제로 만든 AI의 사례를 얘기해주세요. 일반인이 AI 만드는 방법요.
“도요타에서 정확히 어떤 케이스를 쓰는지는 NDA라 말씀 못 드려요. 도요타 이름을 떼고 설명해 볼께요. 제조 공정에서 불량품 검수를 AI로 하고 싶을 경우요. 또는 공장에서 직원들이 안전모나 안전조끼, 안전장갑 같은 보호 장비를 잘 착용하고 있는지를 탐지하는 AI를 원할 경우요. 불량품 검수는 보통 생산 라인에서 카메라로 제품을 찍고, 사람이 사진을 눈으로 보고 ‘불량품이다, 양품이다’고 판정할텐데, 이런 사진 데이터들을 모아서 슈퍼브에이아이 플랫폼에다 업로드해요.”
“슈퍼브에이아이 플랫폼은 세 가지 단계가 있어요. 첫번째 업로드된 데이터를 라벨링해요. AI 학습을 하기 전에 데이터 라벨링할 텐데, 라벨링 할 때도 예컨데 100장이든 1000장이든 모든 데이터를 사람이 일일이 라벨링하는 방식이 아니예요. 전체의 한 10% 정도만 사람이 라벨링하면 그 데이터를 가지고서 슈퍼브에이아이 플랫폼 안에 있는 자동 라벨링 AI가 나머지를 처리해요. 자동라벨링 AI가 10%의 데이터를 학습해 나머지 90%의 데이터를 반자동으로 라벨링해주죠.”
“두 번째 단계는 데이터 선별요. 데이터 선별은 내가 가지고 있는 데이터 중에 유의미한 데이터가 많이 포함되어 있는지, 아니면 특이한 케이스들은 어떤 게 있는지, 확인하는 작업이예요. 슈퍼브에이아이 플랫폼이 이 데이터면 AI를 충분히 학습할만하다든지, 또는 아직은 데이터가 부족하다와 같이 판별합니다. 데이터가 부족할 경우, 생성 AI를 이용해 합성 데이터를 만들어낼 수도 있어요.”
-있는 데이터말고도, 따로 데이터를 생성해서 데이터를 보충한다는 건가요?
“불량품 검수의 사례에선 불량이 여러 유형이 있을 텐데, 촬영된 수량이 적은 유형이 있을 수 있잖아요? 생성 AI를 이용해 이런 유형의 데이터를 추가로 확보하는거죠. 마지막 단계는 이런 데이터셋을 AI 모델 학습합니다. 모델을 학습할 때도 슈퍼브에이아이가 제공해 드리는 여러 종류의 모델들이 있어요. 객체를 탐지할 수 있는 모델도 있고, 객체 분류할 수 있는 모델도 있고, 생성의 모델도 있고 여러 가지가 있어요. 고객이 원하는 모델을 선택해 ‘학습하기’ 버튼을 딱 누르면, 자동으로 한 4시간에서 8시간 정도 지나면 학습이 돼요.”
“학습되면, 이 AI 모델의 성능이 어떤지, 정확도는 어느 정도인지, 아직 학습이 잘 안 된 케이스는 어떤 건지, 이런 정보를 이용자에게 알려드립니다. 학습된 이후에 충분히 쓸만하다는 판단이 되면, 현장에 배포해 AI 모델을 활용합니다.”
2. 불량 검수 등 온갖 AI 모델은 이미 시장에 있다...하지만 비싸고 나만을 위한 게 아니다.
-지금 말씀한 불량품 검수와 같은 인공지능 시스템은 벌써 몇 년 전부터 나왔잖아요. 이제와서 현장 직원들이 불량품 검수 AI를 만들어야할 필요가 있을까요? 나와있는걸 사서 쓰면 그만 아닌가요?
“네. 기존에 비전 검수라는게 있었죠. 사실 비전 검수 뿐만 아니라, 굉장히 다양한 분야에서 다양한 기능을 가진 AI 모델을 제공하는 AI 밴더들이 있어요. CCTV AI도 있고요. 이런 기존 AI밴더들은 두 가지 중 하나예요. 하나는 솔루션을 만들어놓고 이걸 모든 고객한테 똑같이 팔아요. ‘이런 유형의 불량품을 잡아내는 비전 검수 AI’를 만들어서, 수십~수백곳의 고객에게 이 똑 같은 제품을 팔아요.근데 고객마다 원하는 게 조금씩 다를 거잖아요. 상품에 따라 불량 유형이 조금씩 다르니까. 100% 커스터마이즈가 안 돼, 성능이 떨어져요. 두번째 유형의 벤더들은 이런 니즈를 해소하기 위해 각각의 고객마다 매번 커스터마이즈하는 비즈니스를 하죠.”
(중략)
“단, AI를 커스터마이즈로 개발하지만 개발 방식을 생각해보세요. 매번 다수의 AI 개발자들이 투입돼 각 고객마다 AI를 만들어 제공하는거잖아요. 고객 입장에서는 AI를 제공받기까지 시간이 되게 오래 걸리고 비용도 많이 들어요. 여기다 생산 라인이 추가된다든지 새로운 불량품 유형이 발생한다든지, 새 제품을 생산한다든지 그때마다 업데이트를 해야 되거든요. 도입한 AI는 불량 유형을 abc 3개를 탐지할 수 있는데 d라는 새로운 불량 유형이 발생했으면 업데이트해야죠. 외부 업체에 맡기면 다시 3개월, 6개월씩 걸리는 거예요.”
-6개월이란 시간은 엄청난 손실인 거죠. 돈보다 더 큰.
“예. 그러다보니 생산은 늦어지고 엄청 손실이 발생하죠. 슈퍼브에이아이는 AI 개발을 자동화한 게 핵심 기술이예요. 외부 맡기면 3개월씩 걸리던게, 슈퍼브에이아이 플랫폼 안에서 일주일이나, 빠르면 하루에 업데이트를 할 수 있어요. 외부 벤더에 의존하지 않고 자체적으로 내재화해 운영하니, 본인들이 필요할 때마다 AI 모델을 업데이트하고 새로 개발할 수 있죠. 가장 큰 메리트는 이겁니다.”
-제가 이해를 제대로 했을까요. 예컨대 청바지가 등장하자, 먼저 기성품 청바지를 만드는 의류 업자들이 등장했다. 청바지를 28, 29, 30인치와 같이 만들어서 쫙 뿌렸어요. 물론 내 몸에 딱 맞지 않아. 두 번째는 맞춤 청바지. 치수 재서 만들어주는데 시간이 걸려. 살찌면 청바지 새로 사거나, 수선해야된다. 슈퍼브에이아이는 ‘당신 옷은 당신이 직접 만들어라’는 것. 당신이 가진 데이터를 가지고 어떤 AI 모델을 만들지는 당신이 가장 잘 아니까. 슈퍼브에이아이는 의류 재봉 기술이 없는 일반인에게 ‘의류용 3D 프린터’를 제공해주는 것? 필요한 정보만 넣으면 뚝딱 청바지를 만들어준다?
“비유를 엄청 잘 들어주시네요. 맞습니다.”
-문제는 ‘3D 프린터’는 안 팔렸잖아요. ‘AI 개발 플랫폼’이란 말은 쉽지만, 실제 현장에 쓰일 수 있는만큼의 편의성을 갖는데는, 기술적인 벽이 높은 것 아닌가요?
“맞아요. 7년째 사업하면서 어떻게 하면 AI 개발을 더 쉽게 자동화할 수 있을지 조금씩 해결해나가고 있어요. 코딩에 대한 지식이 전혀 없는 분들도 그냥 단순한 UI를 이용해 AI를 만들게 하려면 슈퍼브에이아이가 자동화해야하는거죠. 자동으로 데이터를 라벨링하고 자동으로 데이터를 선별 분석하고 자동으로 AI 모델을 학습하는 것들이 기술적 허들이었죠. 슈퍼브에이아이가 계속 쌓아온 그런 기술인 거죠.”
-솔직히는 ‘내가 코딩을 못해도 AI 모델을 개발할 수 있다’는 말씀은 쉽게 믿진 못하겠어요. 상당수 기업에서 ‘인공지능 도입했다’고 하는데, 많은 경우는 외려 재앙이거든요. 단적으로 라벨링이란게, 현장의 직원들에게 단순 입력 노동을 무한 강제하곤 했죠. 현장에 도움은커녕, 계륵과 같은….
“네. 잘 알고 있습니다. 라벨링을 포함해 AI 개발 비용이 엄청 높아요. 라벨링도 그렇고, 뒷단의 AI 모델 학습이나 데이터 분석은 엄두를 못 내는 기업들이 되게 많아요. 왜냐하면 사내에 AI 개발자나 데이터 엔지니어가 없으니까. 외부 밴더들한테 솔루션을 구매할 수밖에 없는거죠. 반대로 슈퍼브에이아이가 바라보는 시장의 문제이자 기회였어요. 사실 슈퍼브에이아이가 창업한 다음해인 2019년에 가장 먼저 론칭한게, 데이터 라벨링을 노동력으로 하는게 아니라, 최대한 자동화하는 기술이었어요.”
-데이터 라벨링을 자동화한다? 어떻게요?
“제일 중요한건, 최소한 데이터를 라벨링하고도 좋은 AI를 만들고, 이 AI로 나머지 라벨링을 자동으로 처리하는 겁니다. 그리고 라벨링할 데이터의 선별하는 것도 기술입니다. 예를 들어 사진 1만 장이 있을때, 어떤 100장을 라벨링해 AI 모델을 학습해야 성능이 제일 높을 것인가? 이런 100장을 추려내는 기술이 필요해요.
(중략)
3. 개발자 없는 회사도, 각자 보유한 데이터로, 각자 필요한 AI모델을 만드는 세상을 꿈꾼다
-슈퍼브에이아이 플랫폼에서 만들어진 실제 AI 모델 사례는? 그러니까 일반인이 만든 모델요.
-불량 검수나 CCTV말고, 다른 사례는요?
-인간이 이전에 직접하던 작업을 대신 맡아주는 AI 모델이네요.
-비용 문제가 중요하지 않을까요? 예컨대 언급하신 졸음운전 감시 솔루션도 사실 시장에 이미 나와 있어요. 슈퍼브에이아이 플랫폼을 활용하는 가격이 이것보다 비싸면 소용없잖아요? 금액 공개 가능한가요?
-창업 직후엔 주로 사업영역이 데이터 라벨링이었죠. 당시 시장 경쟁 탓에 다들 어려웠을 텐데요.
4. “올 상반기에 작년 매출만큼 벌었습니다”
-성장의 핵심 지표는 무엇일까요? 현재 고객 수는? 매출은?
-듀크대 박사 과정 포기하고 2018년 창업했습니다.
-SKT는 연봉도 그렇고, 한국에서는 소위 S급 직장인데요. 커리어에도 보탬이 되고. 왜 그만뒀나요.
5. “나는 로봇같은 사람이란 말 듣던, 뼛속까지 공대생인데...구조조정할 때는 감정적으로 힘들었다”
-창업 7년간 순탄해 보이는데, 현타의 순간은 없었을까요.
-상장도 검토하는 걸로 압니다. 해외 시장도 이미 진출했죠?
-AI 스타트업인데, ‘AI 시대에는 구글 등 미국 빅테크가 세계 장악한다’는 이야기에 동의하나요?
-AI 알고리즘은 결국 거의 공짜로 가져다 쓸 수 있을테고, 중요한건, ‘본인만의 AI 모델을 만들때 쓸 학습 데이터’다?