슈퍼브에이아이의 2022년을 돌아봅니다
2022년은 저희에게 매우 특별한 한 해입니다. 올해 여러분의 많은 사랑으로 성공적인 시리즈B 투자유치를 마무리할 수 있었습니다. 팀원들은 이제 100명 규모로 성장했고 그 과정에서 많은 분들이 더 쉽게 AI를 개발할 수 있도록 스위트(Suite)의 새로운 기능을 출시하고 데이터 서비스는 더 체계적인 사업으로 거듭났습니다.
지난 365일간의 흥미로운 이야기
- 투자 : 220억 규모 시리즈B 투자를 유치했으며, 총 누적 투자금액은 360억 원 입니다.
- 팀 : 일본 시장에 진출했습니다. 이로써 KR,US,JP 본부에는 총 100여명의 직원이 근무합니다. 계속해서 글로벌 팀이 확장되고 있음에 따라 모든 팀이 공통된 가치를 공유하기 위해 핵심가치를 재정비했습니다. 우리의 새로운 핵심가치는 Move Fast - 빠른 시도, 빠른 실패, 빠른 실행, Be Honest and Transparent - 투명한 소통, 상호 존중, 합리적 의사결정, Innovate - 새로운 시각, 시장 개척, 특별한 생각, Relationships Matter - 같이의 가치, 감동, 신뢰, Take Ownership - 책임감, 주도적인 자세, 기여, Champion Diversity - 틀린 게 아니고 다른 것, 배려, 포용입니다.
- 데이터 : 스위트를 활용하여 생성/구축된 데이터 라벨이 1억 3천만개를 돌파했습니다.
- 소통 : 총 14번의 AMA 세션을 열었습니다. 대부분의 세션 호스트는 저였고 팀원들이 궁금해하는 내용에 대해 모두 직접 답변하는 시간을 가졌습니다.
- 뉴스레터 : 총 31번의 뉴스레터를 발행했습니다. 뉴스레터는 미국팀, 한국팀이 각 현지에 맞는 이슈들을 전하고 있습니다. 한국팀이 전하는 MLOps 관련 소식을 전하는 MLops insight 와 미국팀의 컴퓨터 비전 실무자를 위한 커뮤니티 뉴스레터인 The Ground Truth입니다. 총 1만 3천여 분이 뉴스레터를 봐주셨습니다.
- 컨퍼런스 : 업계 최고의 인공지능 컨퍼런스 AI42022, 컴퓨터 비전 및 패턴 인식 컨퍼런스 CVPR2022에 참석했으며 그 외에도 DataAISummit, ComputerVisionSummit, applyconf 등 다양한 컨퍼런스에 참가했습니다.
- 초청연사 : 총 13+ 곳의 행사 및 이벤트에 초청 연사로 참여했습니다. 이 중에는 AWS Seoul Summit 2022,AWS Community Day 2022, Computer Vision Summit, AIAI CV Summit, MLOps World Bay Area Summit 등이 포함되어 있습니다.
- 언론과 협업 : ’KOREA AI STARTUP 100' 2년 연속 선정되었고, 김현수 CEO는 ‘정보 통신 발전’ 부문 대통령 표창을 수상했습니다. 기술 발전을 위해 다양한 기업과 파트너쉽 관계를 맺었습니다. 2022년에 파트너쉽을 맺은 파트너사는 뉴워커, 올거나이즈, 쿤텍입니다.
제품 주요 업데이트
고객분들에게 더 쉬운 AI를 제공하기 위해 정기적인 스프린트를 진행하고 있으며 미스라벨 디텍션(Mislabel detection), 시맨틱 서치(Semantic Search), 큐레이션(Curation(Test/Training set))과 같은 고도화된 AI 자동화 기술이 적용되었습니다.
- 미스라벨 디텍션(Mislabel detection)은 라벨링 된 데이터셋이 잘못 분류되었을 가능성이 가장 높은 순서대로 데이터를 나열해 줍니다. 그리고 이 데이터를 리뷰할 수 있습니다.
- 시맨틱 서치(Semantic Search)에서는 데이터셋을 살펴보고 원하는 이미지를 찾을 수 있습니다. 유저는 자연어 쿼리와 이미지 쿼리를 조합하여 유동적이고 직관적인 쿼리를 작성할 수 있습니다. 이미지 쿼리를 사용하려는 유저는 로컬 환경에서 새로운 이미지를 업로드하거나 이미 업로드된 데이터셋의 이미지를 선택하여 사용할 수 있습니다.
- 큐레이션(Curation(Test/Training set))은 모델 테스트/훈련에 적합한 편향성 적은 데이터셋을 선별할 수 있도록 지원합니다.
이외에도 오토라벨링(Auto-labeling)은 정확도가 2.6배 향상되고, 라벨링 효율/속도는 약 2배 이상 높아졌습니다.
- 프로젝트 분석 결과를 실시간으로 받아볼 수 있습니다
해당 업데이트로 프로젝트 분석(Project Analytics) 탭의 결과 차트는 거의 실시간으로 받아볼 수 있습니다. 유저 리포트 다운로드 또한 실시간에 가까워졌습니다. 이전에는 보고서 생성 시간이 라벨 수에 따라 선형적으로 늘어났지만, 이제는 평균 10초 미만, 500,000 라벨에 대해서는 1분 미만으로 조정되었습니다.
- 라벨링 프로젝트의 효율을 극적으로 높이고 있습니다.
대규모 데이터/라벨 작업 성능이 향상되었습니다. 리뷰어 역할이 추가되었고 리뷰어는 모든 라벨을 볼 수 있으며 요청 받은 라벨들을 수정하고 리뷰할 수 있습니다. 대규모 작업 지원이 개선되면서, 스위트 상단의 액션 트래커에서 작업 완료 여부 및 실행자 정보가 기록됩니다. 또한, 리뷰 현황과 리뷰가 요청된 라벨의 백분율을 쉽게 확인하실 수 있습니다.
그 외의 다음의 정보들을 쉽게 확인할 수 있습니다.
- 라벨링 현황 (Labeling Progress)
- 라벨 당 오브젝트의 평균 개수 (Average Object Count per Label)
- 라벨러별 라벨당 평균 시간 (Average Time per Label by Labeler)
- 어노테이션 유형 업데이트
2D큐보이드 어노테이션 유형이 추가되었습니다. 어노테이션 유형은 계속해서 업데이트 됩니다.
- 새로운 클라우드 업로드를 지원합니다
Azure Blob Storage 클라우드의 업로드를 지원합니다. * AWS S3 및 Google Cloud Storage 와 매우 유사하게 작동합니다.
당연하지만 제품의 사용성이 좋아졌고, 계속해서 좋아지고 있습니다
- 개선된 온보딩 튜토리얼 : 쉽게 적응할 수 있도록 스위트 가입 후 기존의 온보딩 튜토리얼 에서 튜토리얼 가이드를 추가 했습니다.
- 페이지 사용성 개선 : 오토라벨링 설정 페이지에 튜토리얼이 추가되었습니다. 사용자가 CAL을 프로젝트에 성공적으로 적용했을 때 나타나는 팝업 창에 옵션을 표시(Labels 또는 Auto-Label 탭)합니다. Data 페이지에서는 필터를 활용해 원하는 데이터만 필터링해 볼 수 있는데, 데이터 유형(data type) 필터가 추가되었습니다. 데이터를 프로젝트에 연결하고자 할 때, 이제 드롭다운 리스트에 프로젝트 데이터 유형이 표시됩니다. 'Data' 페이지에서는 프로젝트, 업로더, 생성 날짜에 대한 필터를 드롭다운 메뉴로 추가 적용해 데이터를 필터링할 수 있습니다.
- 앱 사용성 개선 : 폴리곤/폴리라인의 사용을 위한 단축키가 추가되었습니다. 클라우드 업로드 진행 상황이 액션 트래커에 표시되며 역할별, 순서별로 필터가 보이도록 조정하여 관련 필터를 서로 가깝게, 자주 사용하는 필터를 바로 확인할 수 있습니다.
- 새로운 동기화 버튼: 사용자는 동기화 아이콘을 클릭하여 최신 분석 데이터를 가져올 수 있습니다 사용자를 더 잘 안내하기 위해 Custom Auto Label 페이지와 오토라벨 페이지 링크가 추가됐습니다.
- 다국어 지원 : 사용 언어에 일본어가 추가되었습니다.
머신러닝의 자동화를 위해
Data Ops 플랫폼으로 나아갑니다
머신러닝 모델의 성능을 개선하는 것은 쉽지 않습니다. 대부분의 경우 일단 직감에 따라 코드를 개선하고 더 좋은 알고리즘을 찾죠. 하지만 이렇게 진행하게 되면, 잘못된 데이터들은 개선되지 않은 채 그대로 남게 되어 데이터 중복이나 편향성이 더 커지게 됩니다. 여기에 학습 데이터 규모, 다양성이 늘어난다면 오류와 불균형이 발생할 확률이 기하급수적으로 증가하게 되어 모델 성능을 높이는 것은 더 어려워질 수 밖에 없습니다.
지속적인 모델 성능 개선을 위해 데이터를 손쉽게 찾아 활용하고 싶으신가요? 저희 머신러닝 팀은 항상 고품질의 데이터를 이용할 수 있게, Data ops 플랫폼으로 나아가기 위해 우리는 더 많은 준비를 하고 있습니다. 다가오는 업데이트도 기대해주세요!
올해 가장 많은 조회 수를 기록한 글
올해 가장 많은 주목을 받은 글은 시리즈B 투자 유치에 관한 글입니다. 투자 혹한기에도 성공적으로 투자를 유치한 건에 대해 많은 분들이 관심을 가져주셨어요. 다음으로는 스위트의 상세 기능과 적용 방법에 대한 관심이 높았습니다.
최근 투자 시장 상황이 예전과 달라지면서 업계를 불문하고 혼란이 오고 있습니다. 이런 시기에 어느덧 시리즈 B까지 달려올 수 있었다는 것에 자랑스러움보다 먼저 여러 방면에서 지지해 주신 분들께 감사한 마음이 앞섭니다. 올해 시리즈 B 투자에는 기존 투자자인 프리미어 파트너스, 미국 듀크대학교, KT 인베스트먼트 등이 추가 출자했으며, 신규 투자자로는 산업은행, KT&G, 국내 자동차 부품 제조사인 만도의 모회사 한라그룹 등이 참여했고 이로써 슈퍼브에이아이의 누적 투자금액은 총 360억원 입니다.
- 한국의 기업들은 Data-Centric AI에 얼마나 준비되어 있을까요?
수많은 기업들을 만나며 머신 러닝 데이터 구축 및 관리 작업에서의 자동화와 효율화를 가치를 전달해온 슈퍼브에이아이가 작성한 백서 ‘한국의 기업들은 Data-Centric -AI에 얼마나 준비되어 있을까?’의 일부 내용을 다루고 있습니다. 백서 에서는 다른 기업들의 현황도 살펴보고, 우리 기업의 현황이 어떤지도 진단해 볼 수 있습니다.
이 글에서는 어떤 상황에서 라벨링 자동화를 진행하면 좋을지, 이점은 무엇인지에 대한 내용을 상세하게 다루고 있습니다. 사람이 직접 작업하는 매뉴얼 라벨링과 자동화된 라벨링 중 어떤 라벨링 방식을 선택할지는 프로젝트의 유형과 현재 어느 단계를 진행하고 있는지에 따라 달라지며 각 상황에 따라 어떤 방식을 선택하면 좋을지에 대한 내용을 소개합니다.
- 스위트 오토라벨링으로 이미지 분류용 AI 모델 학습시키기
컴퓨터 비전 모델이 이미지를 정확하게 탐지하지 못하는 모델은 현실에 적용해 봤자 쓸모가 없거나, 더 심각한 경우 위험한 상황을 일으킬 수도 있습니다. 이렇듯 컴퓨터 비전 모델이 제대로 물체를 식별해 내지 못하면 재해에 가까운 결과를 불러올 수 있지만, 학습이 제대로 된 모델은 워크플로우를 수월하게 하고, 의학적인 미스터리를 풀어주고, 운송 문제를 해결해 주기도 하죠. 이 글에서는 스위트를 통해 올바른 컴퓨터 비전 모델을 구축하고 실제 AI 모델을 학습시키는 내용을 다루고 있습니다.
정말 감사했습니다 : 2022년 이후의 계획
저희는 모든 기업이 AI를 도입하는 것을 목표로 하고 있습니다. 이를 위해 AI 개발 생태계의 기반을 만드는 중이기도 하고요. 한국 시장에서의 AI에 대한 이해도가 몇 년 전보다 훨씬 높아지고 있고 머지않은 미래에 거의 모든 기업이 AI 도입에 나설 것이란 확신을 가지고 있습니다. AI가 만능은 아니지만, AI를 잘 이해하고 다룰 준비가 되어 있는 기업이라면 과거와는 다른 모습으로 탈바꿈할 무기로 삼을 수 있다고 믿습니다.
2022년에는 성공적으로 시리즈B 투자유치를 마무리했고 이를 통해서 사업과 전략을 확장할 수 있었습니다. 또한, 여러분들에게 더 나은 서비스를 제공할 수 있도록 최선을 다하고 있습니다. 내년에는 올해와는 또 다른 흥미로운 일들을 계획 중에 있으니 기대해 주셔도 좋습니다.