SUPERB AI

SUPERB AI

데이터 프렙 옵스가 머신러닝 라이프 사이클의 잃어버린 퍼즐 조각이 맞을까?
저널

데이터 프렙 옵스가 머신러닝 라이프 사이클의 잃어버린 퍼즐 조각이 맞을까?

일반적인 머신러닝 라이프 사이클은 세 가지로 구성됩니다. (1) 데이터 준비(데이터의 수집, 보관, 증강, 라벨링, 검증, 기능 선택), (2) 모델 개발(하이퍼파라미터 튜닝, 모델의 선택, 훈련, 테스트, 검증), 그리고 (3) 모델 운용(모델의 인퍼런스, 모니터링, 유지보수)입니다. 하지만 머신러닝 전문가들이 흔히 간과하지만 사실은 머신러닝 라이프 사이클에서 가장 중요한 영역이 있습니다.
19 min read
슈퍼브에이아이 커스텀 오토 라벨의 완벽 활용 가이드
저널

슈퍼브에이아이 커스텀 오토 라벨의 완벽 활용 가이드

속도와 정확성을 위한 고품질의 정답 데이터와 올바른 훈련 이터레이션 슈퍼브에이아이의 커스텀 오토 라벨은 데이터셋의 구축과 이터레이션에 드는 시간을 획기적으로 감소시켜줄 수 있는 강력한 툴입니다. 이 똑똑한 자동화 툴이 있으면 큰 사이즈의 데이터셋 준비를 수동으로 하는 것은 옛일이 될 것입니다. 특정 유즈 케이스에 적합하게 조정한 커스텀 오토 라벨을 구축하는 것은 어렵지
19 min read
롱테일 컴퓨터 비전을 위한 커스텀 오토 라벨을 소개합니다
저널

롱테일 컴퓨터 비전을 위한 커스텀 오토 라벨을 소개합니다

들어가면서 새롭게 개선된 슈퍼브에이아이의 커스텀 오토 라벨(Custom Auto-Label)을 여러분께 소개하게 되어 기쁩니다. 슈퍼브에이아이의 커스텀 오토 라벨은 데이터 라벨링 워크플로우를 자동화하여 컴퓨터 비전팀이 획기적이면서도 안정적인 롱테일 컴퓨터 비전(Computer Vision, CV) 모델을 개발할 수 있도록 돕습니다. 실제로 CV 어플리케이션을 구축할 때 투자가 필요한 부분은, 현실 속 시나리오에서 간과하기 쉬운
14 min read
대규모 라벨 검수의 새로운 방법, 직관적인 인터페이스를 갖춘 ‘매뉴얼 리뷰’를 소개합니다.
업데이트 소식

대규모 라벨 검수의 새로운 방법, 직관적인 인터페이스를 갖춘 ‘매뉴얼 리뷰’를 소개합니다.

당신의 데이터 라벨링, 이제 Suite의 품질 검수 기능이 함께합니다. 들어가며 머신러닝 시스템을 구축해본 경험이 있다면, 학습용 데이터셋의 품질이 시스템 성능에 미치는 영향을 알고 있을 것입니다. 정확하게 라벨링된 데이터셋은 머신러닝 시스템 개발을 촉진하고, 성능을 향상시킬 수 있습니다. 하지만 진정한 의미의 고품질 라벨링 데이터셋은 쉽게 구하기 어렵습니다. 데이터 라벨링 프로세스에는 데이터를 수집
13 min read
글로벌 수준의 철저한 보안 운영을 입증하는 SOC 2 Type II 인증 획득!
제품 및 서비스

글로벌 수준의 철저한 보안 운영을 입증하는 SOC 2 Type II 인증 획득!

‍ 많은 분들이 아시다시피, 지금까지 저희는 업계에서 가장 고도화된 데이터 관리 플랫폼을 구축하는 데 집중해 왔습니다. Superb AI팀은 어떤 면에서든 안전하고 온전한 플랫폼으로의 자격을 갖추기 위해 데이터 처리, 보안 및 기밀성에 관한 가장 엄격한 프로토콜을 준수하는 노력을 해왔는데요. 엄격하고 철저한 시스템 감사를 거쳐 SOC 2 Type II 인증을 획득하게 되었다는 기쁜
4 min read
Superb AI Suite와 Pachyderm Hub로 Data-centric AI 애플리케이션 만들기
제품 및 서비스

Superb AI Suite와 Pachyderm Hub로 Data-centric AI 애플리케이션 만들기

시작하며 데이터는 새로운 소스 코드가 되었으며 이를 관리할 방법이 필요합니다. 데이터는 매우 중요하기 때문에 AI 분야의 선도적인 많은 실무자들은 데이터가 머신러닝 워크플로우의 중심이 되어야 한다고 주장하고 있습니다. 수년 동안 코드는 소프트웨어 개발의 중심이었습니다. 그리고 멋진 도구와 프로세스를 개발하여 더 민첩하고 효과적인 훌륭한 소프트웨어를 만들어왔습니다. 하지만 오늘날 업계에서는 머신러닝 소프트웨어의 급격한
11 min read
새롭게 UI/UX 리뉴얼을 진행한 Suite v1.10.0을 소개합니다
업데이트 소식

새롭게 UI/UX 리뉴얼을 진행한 Suite v1.10.0을 소개합니다

작년 8월 Suite 정식 버전이 출시된 이후로 벌써 1년이라는 시간이 흘렀습니다. 그동안 여러 ML, 라벨링 팀에서 Suite를 찾아주셨는데요. 그동안 저희 Superb AI팀은 고객의 니즈를 반영하는 동시에, 특수 데이터 라벨링 자동화 기능(a.k.a 커스텀 오토라벨링)을 선보이며 머신러닝 데이터 구축에 필요한 기능들을 Suite를 통해 제공해왔습니다. v1.10.0 업데이트에서는
8 min read
대부분의 컴퓨터 비전팀이 풀지 못한 DataOps의 세 가지 난제 Part2
저널 Featured

대부분의 컴퓨터 비전팀이 풀지 못한 DataOps의 세 가지 난제 Part2

*본 글은 Superb AI의 James Le가 작성한 ‘Part 2: Three DataOps Challenges That Most Computer Vision Teams Struggle With’의 번역본입니다. ‍ ‍ 시작하며 ‍ 최첨단 아키텍처를 구현하고 모델 하이퍼파라미터를 조정하고 손실 함수를 최적화하는 것은 머신러닝의 재미있는 부분입니다. 겉으로는 있어 보이는 작업처럼 보일 수 있지만 상용화를 완료한 모델의 뒤에는 고품질 학습용 데이터셋을 구축하는
20 min read
컴퓨터 비전 데이터에 대한 모든 것
저널 Featured

컴퓨터 비전 데이터에 대한 모든 것

컴퓨터 비전이란 무엇인가? 컴퓨터 비전이라는 말에 이미 ‘시각'(vision)이라는 단어가 포함되어 있어서 유추할 수 있듯이, 사람의 시각과 관련한 시스템 구조를 모방하여 컴퓨터도 물체나 상황을 식별하고 해석할 수 있도록 하는 연구 분야입니다. 컴퓨터 비전에서 다루는 데이터에는 이미지와 이미지 속 텍스트를 인지하는 영역뿐만 아니라 비디오와 3D 영상도 포함됩니다. 비디오 영상은
23 min read
아리랑 위성이 수집한 영상 데이터 80만 건, AI가 되다
성공사례

아리랑 위성이 수집한 영상 데이터 80만 건, AI가 되다

들어가며 밤하늘을 바라보면 유독 밝게 빛나며 움직이는 불빛이 있습니다. 별이라고 생각할 수 있지만 대부분 ‘저궤도 위성’으로, 다른 위성보다 지구와 가까이 위치하여 자주 볼 수 있는데요. 우리나라에서는 ‘아리랑 위성’이 대표적인 저궤도 위성입니다. 아리랑 위성은 국내 유일의 다목적실용위성으로, 1999년 1호가 최초 발사된 이후 현재는 3호·5호·3A호가 운행되고 있으며, 2022년에는
10 min read
Suite와 Valohai로 YOLOv3 파이프라인 설계하기
제품 및 서비스

Suite와 Valohai로 YOLOv3 파이프라인 설계하기

지난 포스팅에서는 Superb AI Suite와 Valohai, 두 플랫폼이 서로를 어떻게 보완하고 있는지에 대해 다뤘는데요. 이번에는 두 플랫폼에서 사전 학습된 가중치와 전이학습(Transfer Learning)을 사용하여 컴퓨터 비전 모델을 학습시키는 파이프라인을 보여드리려고 합니다. 이번 모델에서는 실시간 객체 감지용으로 구축된 YOLOv3를 사용할 예정입니다. 이 실험에서 학습용 데이터의 관리 및 라벨링은 모두 Superb
10 min read
컴퓨터 비전 데이터를 위한 DataOps의 모든 것 Part1
저널

컴퓨터 비전 데이터를 위한 DataOps의 모든 것 Part1

*본 글은 Superb AI의 James Le가 작성한 ‘Part 1: An Overview of DataOps For Computer Vision’의 번역본입니다. ‍ 일반적으로 머신러닝 애플리케이션, 특히 컴퓨터 비전 애플리케이션 모델 학습은 데이터에 크게 의존합니다. 상용화 시스템에서는 추론을 수행하기 위해 입력 데이터가 공급되는데요. 이 추론의 결과값은 다시, 이어서 진행되는 반복 학습의 입력값으로 투입되어 훈련 데이터의
25 min read
Superb AI CTO가 전하는 Data-centric MLOps
저널

Superb AI CTO가 전하는 Data-centric MLOps

Superb AI는 데이터, 개발, 운영의 분리로 인해 생기는 사일로가 머신러닝의 상용화를 늦추고 있다는 데 일찍이 문제의식을 느끼고 머신러닝 파이프라인의 각 단계가 유기적으로 순환할 수 있도록 돕는, MLOps를 위한 머신러닝 데이터 플랫폼을 구축하고 있습니다. ‍ 아시는 분들도 계시겠지만, 저희는 실리콘밸리 산마테오에 현지 법인을 두고 국내 시장 뿐만 아니라 북미 시장을 대상으로 활발한
16 min read
Superb AI와 Valohai가 만나다!
제품 및 서비스

Superb AI와 Valohai가 만나다!

컴퓨터 비전 개발을 위한 End-to-End 솔루션 컴퓨터 비전(Computer Vision)은 최근 10년 동안 가장 폭발적으로 성장한 기술 중 하나입니다. 자율 주행이나 얼굴인식 같은 우리 삶에 밀접한 기술뿐 아니라, 보이지 않는 곳에서 연구되고 있는 AI 기반 지리 정보·의료 영상까지, 컴퓨터 비전은 산업 전반에 새로운 기회를 불어넣고 있습니다. 하지만 혁신을
11 min read
Auto-Label: Part 1. Suite의 오토라벨 기술 들여다보기
제품 및 서비스

Auto-Label: Part 1. Suite의 오토라벨 기술 들여다보기

**본 글은 Superb AI의 김계현 CRO(Chief Research Officer)가 작성한 ‘Auto-Labeling: Part 1. Introduction to Superb AI’s Auto-Labeling Tech’의 번역본입니다. 오토라벨은 데이터 라벨링의 생산성을 최대 10배까지 향상시킬 수 있는 라벨링 자동화 기술입니다. 이번 블로그 시리즈에서는 Superb AI Suite의 주요 기술인 오토라벨에 대해 소개하고, 오토라벨에 적용된 기술이 실제로
17 min read
고객을 가장 가까이에서, 세일즈팀
슈퍼브 팀

고객을 가장 가까이에서, 세일즈팀

안녕하세요. <Superb AI 스프린트 시리즈> 네 번째 콘텐츠와 함께 인사드립니다. 어느덧 시리즈의 마지막에 다다랐네요. 마지막을 장식할 세일즈팀과 함께 4번째 스프린트 시리즈, 바로 시작하겠습니다. *이번 콘텐츠는 세일즈팀 이지훈 님의 인터뷰를 1인칭 시점으로 재구성했습니다. ‍ ‍ 세일즈팀이 말하는 Sprint! Superb AI 세일즈팀의 스프린트는 고객의 목소리를 가장 가까이에서 듣고, 이를 잘 정리하고 취합해
8 min read
기계에게 한글을 가르칠 수 있을까?
성공사례

기계에게 한글을 가르칠 수 있을까?

‍들어가며 사람은 길을 걷다가, 운전을 하다가, 표지판이나 입간판에 적힌 글씨를 한 눈에 읽고 그 의미를 파악합니다. 하지만 기계는 꼬불 꼬불한 그림을 글자로 인식하고, 그것으로부터 의미를 즉각적으로 파악하지 못합니다. 표지판을 읽지 못하는 자율주행차란 세상에 존재할 수 없으므로, 인간의 지능을 갖기 위해서는 글씨를 이해하는 것이 필수적입니다. 그럼, 기계에게 글씨를 어떻게 가르칠 수
12 min read
제품과 고객을 이어주는 콘텐츠팀
슈퍼브 팀

제품과 고객을 이어주는 콘텐츠팀

‍ 안녕하세요. <Superb AI 스프린트 시리즈> 세 번째 콘텐츠와 함께 인사드립니다. 오늘은 흥미롭고 매력적인 업무를 맡고 있는 콘텐츠팀을 초대했습니다. 콘텐츠팀은 Superb AI의 제품에 스토리를 입혀 고객에게 전달하며, 조직에 필요한 도큐먼트를 제작하고 배포합니다. 브랜딩과 마케팅에 활용될 수 있는 콘텐츠 메이킹, 제품 생산자와 사용자 모두를 위한 문서 업데이트를 담당하고 있습니다. 그럼
9 min read
우리 머신러닝 팀이 핵심 업무에 집중하지 못하는 이유
저널

우리 머신러닝 팀이 핵심 업무에 집중하지 못하는 이유

‍ 머신러닝 데이터는 살아있다 머신러닝 개발은 데이터를 넣고 학습시켜 모델을 개발하는 과정을 반복적으로 하는 것이 핵심입니다. 소프트웨어 엔지니어링에서 코드를 효율적으로 빌드하고 테스트하여 배포하도록 돕는 파이프라인 구축을 통해 안정적인 서비스를 제공할 수 있는 것처럼, 인공지능 개발에서는 데이터를 관여시키는 파이프라인 설계가 중요합니다. 그 파이프라인을 잘 이해하는 것은 데이터가 각 단계마다 어떻게 작동하는지 관찰하고
6 min read
Suite를 활용한 머신러닝 워크플로우 실전 체험기
저널

Suite를 활용한 머신러닝 워크플로우 실전 체험기

*이 포스팅은 슈퍼브에이아이의 인턴 홍찬의님이 작성한 글의 번역본입니다. *이 프로젝트에서 사용된 모든 코드는 다음 Github repository에서 볼 수 있습니다. ‍ ‍ 시작하며 2020년은 코로나 바이러스로 뒤덮인 한 해였습니다. 특히 ‘외출 시 마스크 필수착용’이 새로운 사회적 규범이 되면서, 일상이 완전히 바뀌어버렸습니다. 하지만 우리는 습관의 동물인 터라 문 밖을 나설 때 마스크를 써야
18 min read
3년, 2주, 66번째 한 번도 멈춘 적 없는 스프린트
슈퍼브 팀

3년, 2주, 66번째 한 번도 멈춘 적 없는 스프린트

스크럼 프로세스 ‍IT산업에 계신 분들은 한 번쯤 애자일, 스크럼, 스프린트 같은 단어들을 들어 본 적 있으실 겁니다. 뭔가 린하게 주기를 반복하며 효율적인 업무 진행을 추구하는 팀의 팀원이라면 여기저기서 많이 들어보셨을 것으로 생각합니다. 이미 몸담고 있는 조직에서 활발히 사용하고 계실지도 모르겠네요. 여러분께 당당하게 소개합니다. 슈퍼브에이아이는 스프린트 마니아입니다! ‍ 스프린트?! 들어보기는 했는데.. 스프린트는
11 min read
데이터 준비 5단계, 실리콘밸리에서는 어떤 플랫폼을 사용할까?
저널

데이터 준비 5단계, 실리콘밸리에서는 어떤 플랫폼을 사용할까?

‍ *본 포스팅의 원문은 Arize AI의 기술 블로그에서 볼 수 있습니다. ‍ 전 산업군에서 인공지능(AI)과 머신러닝(ML)을 도입하고 있습니다. 많은 기업이 자사의 비즈니스에 인공지능 기술을 접목하기 위해, 적절한 머신러닝 인프라 플랫폼을 탐색하고 있기도 합니다. 머신러닝 인프라 환경은 혼란스럽고 복잡해서 시장의 다양한 플랫폼과 도구들을 이해하는 건 쉽지 않습니다. 본 포스팅에서는
11 min read
머신러닝 데이터 플랫폼이란?
저널

머신러닝 데이터 플랫폼이란?

‍ 머신러닝 데이터 플랫폼 = 반복되는 데이터 확보, 재학습 사이클을 위한 MLOps 도구 ‍ 머신러닝 개발 과정에서 데이터 작업은 여러 번 반복되어 진행됩니다. 데이터 확보와 가공, 관리는 머신러닝 개발 프로젝트 기간 전체와 서비스 운영 기간 전체에 걸쳐 반복되어야 합니다. 맥킨지(McKinsey)의 분석에 따르면, 34%의 머신러닝 프로젝트 사례에서 데이터 확보와 재학습이 월(
5 min read
성공적인 머신러닝 프로젝트를 위한 17가지 핵심 질문
저널

성공적인 머신러닝 프로젝트를 위한 17가지 핵심 질문

‍ 효율적인 훈련 데이터 구축의 필요성 대두 컴퓨터의 출현, 특히 현대의 데이터베이스 확산 이후로는 대부분의 컴퓨팅 니즈는 정형화된 데이터에 의존했습니다. 디지털 시대가 도래함에 따라, 이미지, 비디오, 텍스트 그리고 오디오 같은 비정형 데이터의 양이 정형 데이터보다 많아졌습니다. Gartner에 따르면, 엔터프라이즈 데이터(enterprise data)의 80%가 비정형 데이터이며, 이 규모가 매년 55~
12 min read
Superb AI의 커스텀 오토라벨링
제품 및 서비스

Superb AI의 커스텀 오토라벨링

‍ 저와 김계현 CRO는 작년에 데이터 라벨링부터 데이터 운영에까지 이르는 전 과정에서 효율성을 높이는 방법이 뭐가 있을까에 대한 이야기를 나눴습니다. 그리고 Superb AI가 자동화(automation)와 애자일한 운영을 지원하는 기능에 집중해야 한다는 결론을 냈습니다. 김계현 CRO가 마침  autoML, Few-shot learning과 Transfer learning과 관련해 높은 수준의 전문성이 있기도 했기에, 이 부분을 Suite에
6 min read