저널 컴퓨터 비전 데이터 큐레이션을 위한 이미지 임베딩이란 무엇인가요? 머신러닝(ML) 및 컴퓨터 비전(CV) 개발자는 주변 사물의 미세한 차이를 인식하는 사람의 능력을 모델로 구현하기 위해 노력합니다. 여기서 궁금해지는 것은 기계가 주변 환경의 사물을 정확하게 식별하도록 어떻게 훈련시킬 수 있을지입니다. 신경망이나 ML 모델에서 일정 수준의 일관된 성능을 달성하는 것과 마찬가지로, 그 해답은 모델 훈련에 사용된 데이터에 있습니다. 일반적인 모델로
AI 인사이트 초거대 언어모델(LLM)과 인간의 두뇌: 딥러닝과 인간의 뇌 그리고 튜링테스트 클라우드 컴퓨팅 기술의 발전과 데이터의 증가로 초거대 언어모델(Large Language Model)이 가용할 수 있는 학습 데이터가 기하급수적으로 늘어나면서 성능이 점점 정교해지고 있다. 이러한 트렌드를 반영하듯 인공지능 업계에서는 ChatGPT는 거대한 변화의 서막일 뿐이라고 보는 견해가 많다. 올해 OpenAI가 공개한 GPT 시리즈의 최신버전 GPT-4.0에는 이전 버전의 1750억개를 아득히 뛰어넘는 약
AI 인사이트 텍스트 검출 및 인식 - 아날로그의 디지털화를 위해 텍스트 검출 및 인식 (Text Detection/Recognition) 텍스트 검출(Text Detection) 및 텍스트 인식(Text Recognition)은 디지털 이미지나 비디오에서 텍스트를 검출하고 인식하는 기술로 흔히 OCR(Optical Character Recognition)이라고도 불립니다. 이러한 텍스트 검출 및 인식 기술은 객체 검출(Object Detection)의 한 분야이며 영상에서 텍스트만을 추출하고 인식합니다. *편의상 텍스트
보도자료 슈퍼브에이아이, 자동으로 균형 잡힌 데이터셋 생성해 주는 '슈퍼브 큐레이트' 신규 출시 [슈퍼브에이아이-2023/04/27] 머신러닝 데이터 관리 플랫폼 기업 슈퍼브에이아이가 자동 데이터셋 생성 기능을 제공하는 ‘슈퍼브 큐레이트(SUPERB Curate)’를 정식 출시했다고 밝혔다. 슈퍼브 큐레이트는 머신러닝 팀이 손쉽게 훈련용 데이터셋을 구축하여 더 강건하고 높은 성능의 모델을 구현할 수 있도록 하는 혁신적인 데이터 큐레이션(Curation; 양질의 데이터를 취합, 선별, 분류, 구조화하는 것)
AI 인사이트 기업들이 ChatGPT 도입을 망설이는 이유: 딥러닝의 발전 과정과 한계극복 작년말 시작된 챗GPT 열풍으로 ‘생성형 AI’의 전성시대가 이어지고있다. 생성형 AI의 등장으로 그동안 인간 고유의 것이라고 생각했던 지식노동과 창작의 영역이 얼마나 손쉽게 인공지능에게 넘어갈 수 있는지를 목격한 사람들은 흥분과 망상의 도가니에 빠지거나 혹은 절망감과 무력감에 허덕이고있다. 대중의 반응을 보면 마치 생성형 AI 전에는 인공지능이 존재하지 않았으며, 생성형 AI가 곧 인공지능을
AI 인사이트 AI 민주화는 어떻게 우리 삶을 바꿀것인가?: ChatGPT가 쏘아올린 거대한 신호탄 챗GPT가 대중에게 공개된지 반년에 가까운 시간이 지났다. 대중의 뜨거운 반응은 본격적인 AI시대의 도래를 실감하게 한다. 인공지능에 회의적이던 사람들 조차 챗GPT의 놀라운 성능에 감탄하기 시작했으며, 누구나 고도화된 개인 챗봇을 활용할 수 있게 되면서 LLM App Store(초거대 언어모델 앱스토어)를 비롯해 수많은 B2C 서비스가 순식간에 세상에 등장했다. 그러나 뜨거운 관심에도 불구하고
성공사례 [애그테크] 슈퍼브 플랫폼과 함께 모델 성능을 크게 개선한 Rowbot 문제 Rowbot은 인하우스 라벨링을 통해 옥수수 세그멘테이션 및 색상 분류를 위한 데이터셋을 구축했는데, 그 과정에서 ML팀의 시간과 자원을 너무 많이 소모하게 되어 고민이라고 전했습니다. 사내 작업 인력을 늘리지는 않으면서도 라벨링 산출물의 양과 질을 개선할 수 있는 방법이 필요했습니다. 해결책 슈퍼브에이아이의 고객 맞춤형 데이터 서비스 및 라벨링 툴을 활용해 어노테이션 된
업데이트 소식 슈퍼브 큐레이트 : 더 적은 데이터로 더 강력한 모델 성능을 구현하세요 그동안 베타 버전으로 제공되었던 슈퍼브 큐레이트를 이제 공식적으로 선보일 수 있게 되었습니다. 슈퍼브 큐레이트는 누구나 한 번쯤은 경험했던 데이터 문제들에 대해 슈퍼브에이아이가 제시하는 해답입니다. “어떤 데이터를 먼저 라벨링 해야 할까?”, “어떤 데이터를 모델 학습에 사용하고, 어떤 데이터를 모델 성능 검증에 사용해야 할까?”, “얼만큼의 데이터를 사용해야 할까?” 등 익숙한 문제들이죠. 슈퍼브
성공사례 [헬스케어] 라벨링 시간을 2주에서 2일로 단축한 FitAtom 문제 Fitatom은 자사의 알고리즘을 만들기 위해 다양한 생체 정보 데이터셋을 대량으로 라벨링해야 했습니다. HITL(human-in-the-loop) 서비스와 인하우스 라벨링 툴을 도입했지만 데이터 및 프로젝트 관리가 효과적이지 않아 산출량이 너무 적고 비용이 너무 많이 드는 것이 문제였습니다. 해결 슈퍼브에이아이의 이미지 키포인트 어노테이션 툴과 매뉴얼 리뷰 프로세스, 고성능 데이터 및 유저 관리 시스템을
성공사례 [로보틱스] 어노테이션 시간을 몇 개월에서 몇 시간으로 단축한 폭스 로보틱스(Fox Robotics) 문제 Fox Robotics는 소규모 팀으로, 수기로 직접 모든 이미지를 라벨링하고 검수하는 것이 상당히 부담될 수 밖에 없었습니다. 결국 Fox Robotics는 자사의 ML 모델 훈련을 위한 현장 및 작물 어노테이션 데이터의 양을 인하우스로는 감당할 수 없다고 판단했습니다. 해결 슈퍼브에이아이의 고객 맞춤형 데이터 서비스와 커스텀 자동 라벨링, 액티브 러닝 워크플로우를 함께 활용해
성공사례 [이커머스/소매] 라벨링 자동화를 통해 고객들이 최적의 신발을 빠르게 찾을 수 있도록 한 펄핏(Perfitt) 문제 신발은 브랜드마다 사이즈가 제각기 다르게 나오는 일이 많습니다. Perfitt은 어떤 사이즈가 사용자의 발에 딱 맞는 크기인지 정밀하게 분석해 추천해 주는 기술을 제공하는 회사입니다. 워낙 높은 정확성이 요구되는 기술이기 때문에 모델 성능을 지속적으로 업그레이드 해야 하고, 그러기 위해서는 데이터 수집부터 모델 훈련까지 전 과정을 아우르는 효율적인 데이터 파이프라인을 구축해야 했습니다.
성공사례 [운송/IoT] 라벨링 자동화로 쉽고 빠르게 결과물을 취득한 엣지비전(Edge Vision) 문제 슈퍼브에이아이를 찾은 Edge Vision은 셀프 호스티드 CVAT 인스턴스와 라벨링 서비스에 과감하게 투자했지만 만족할 만한 품질의 라벨을 얻지 못했다고 했습니다. 사람이 직접 라벨링하면 섬세한 고품질의 라벨을 빠르게 얻을 수 있을 거라고 생각했는데, 오히려 인하우스 ML팀의 시간과 리소스를 너무 많이 소모하는 결과만 낳았습니다. 해결 방법 사용자가 원하는 조건에 맞추어 AI가 자동으로
소식 슈퍼브에이아이 창립 5주년을 맞이하며 슈퍼브에이아이가 창립 5주년을 맞았습니다. 슈퍼브에이아이는 2018년에 설립되어 AI가 필요한 기업의 데이터 품질을 개선하고 목표를 달성하는 데 도움이 되는 MLOps/DataOps 플랫폼을 제공하고 있습니다. 슈퍼브 플랫폼을 통해 데이터 팀은 데이터 수집 및 사전 처리에서 모델 배포 및 모니터링에 이르기까지 전체 머신 러닝 수명 주기를 관리할 수 있습니다. 저희는 지난 5년간 꾸준히
AI 인사이트 노션과 구글 워크스페이스에 AI가 더해지면?: 이전과는 전혀 다른 협업 방식 협업툴과 AI의 만남 안녕하세요, IT린이 제나팡입니다. 오늘은 협업툴의 대표 주자, 구글 워크스페이스와 노션의 최근 동향에 대해 알아보도록 할게요. ChatGPT가 촉발한 초거대 AI의 흐름에 따라, 당연히 협업툴과 AI의 만남은 예정되어 있었습니다. 그렇게 놀랍지 않은 이슈이기도 하죠. 다만, 우리의 업무 플로우를 대부분 차지하고 있는 2개의 플랫폼인만큼, 그 영향력은 매우 클 것 같습니다.
제품 및 서비스 오토 큐레이트(Auto-Curate)로 라벨링 리소스 절감하기: MS COCO 사용 실험 사례 들어가며 슈퍼브 큐레이트(Superb Curate)는 머신러닝 팀이 손쉽게 훈련용 데이터셋을 구축하여 더 강건하고 높은 성능의 모델을 구현할 수 있도록 하는 혁신적인 데이터 큐레이션(Curation; 양질의 데이터를 취합, 선별, 분류, 구조화하는 것) 툴입니다. 특히 슈퍼브 큐레이트의 핵심 기능 중 하나인 오토 큐레이트(Auto-Curate)는 훈련용 데이터셋이나 검증용 데이터셋에 반드시 포함시켜야
제품 및 서비스 오토 큐레이트(Auto-Curate)로 모델 성능 개선하기: LOCO 사용 실험 사례 학습용 데이터셋을 큐레이션해 강건한 모델 구축하기 샘플 데이터가 고르게 분포된 균형 잡힌 데이터셋을 큐레이션(Curation; 양질의 데이터를 취합, 선별, 분류, 구조화하는 것)하는 것은 상당히 어렵습니다. 특히 메타데이터가 드물거나 제한적일 경우 더 그렇죠. 슈퍼브에이아이의 큐레이트(Curate)는 이러한 불편함을 해소하고 사용자들이 희소한 엣지 케이스가 더 많이 포함된 학습용 데이터셋이나 검증용
AI 인사이트 네이버 하이퍼클로바 집중탐구: 글로벌 초대규모 AI 시장으로의 도약 한국어 버전의 초대규모 AI, 왜 필요할까? 안녕하세요, IT린이 제나팡입니다. GPT-3.5에 이은 GPT-4의 등장으로 국내 빅테크의 위기를 거론한 적이 있었죠. 이젠 초대규모 AI 시장은 결국 마이크로소프트와 구글이 주도하고, 국내 빅테크는 아무런 존재감을 드러내지 못 할 수도 있다는 내용이었습니다. 시간과 돈을 들여 초대규모 AI를 개발해도, 의미가 없기 때문이죠. 지난 번에는 네이버,
AI 인사이트 딥러닝 기술의 발전과 ChatGPT 최근에 ChatGPT에 대한 관심이 너무나 많아졌습니다. 저는 작년 (2022년) 말 쯤에 ChatGPT가 발표된 이후 사용해 보면서, GPT 성능이 많이 좋아졌다고 생각하긴 했지만 이렇게 많은 사람들이 열광할 것이라고는 생각하지 못했습니다. 이미 너무 많은 사람들이 ChatGPT에 대해서 말하고 있습니다. 그 중에는 이상한 내용도 많고, 동감가는 내용들도 있는데요, 저도 이러한 현상을 보며 ChatGPT와
AI 인사이트 동영상 분석을 위한 객체 추적 기술 객체 추적 (Object Tracking) Object Tracking (객체 추적)은 영상에서 움직이는 객체를 탐지하고, 그 객체의 움직임을 추적하는 기술입니다. 즉 한 장의 이미지가 아닌 연속된 프레임을 가진 비디오에서 객체의 위치를 추적하는 것이라 볼 수 있습니다. 객체 추적의 기본적인 원리는, 첫 번째 프레임에서 객체를 검출(detection) 하고, 이후 프레임에서 검출된 객체와 유사한
소식 일본의 AI 시장 성장을 함께 합니다 : 슈퍼브에이아이 일본 법인 설립 일본 법인 설립 배경 일본은 인구 노령화와 인력 부족 등으로 인해 혁신적인 기술을 보유하고 있는 동시에, 새로운 기술과 비즈니스 모델에 적극적으로 도전하려는 니즈가 큰 시장입니다. 슈퍼브에이아이는 이런 성장 가능성을 보고 일본에 법인 설립(Superb AI Japan)을 진행했습니다. 일본 진출을 통해 자사의 AI 기술을 일본 시장에 도입하고 기업과 협력하여 시장
AI 인사이트 [3분 알고리즘] XGBoost 랜덤포레스트가 한 번에 다양한 데이터셋을 만들어 그 결과를 평균해 다양한 데이터셋에서 안정적 성능을 얻을 수 있는 알고리즘을 만들었다면 그라디언트 부스팅은 오차가 줄어드는 방향으로 계속 학습을 해가며 정확도를 높일 수 있는 알고리즘이였다. 하지만 그라디언트 부스팅은 이전 학습기의 결과를 이어 받아 순차적으로 학습하기에 시간이 많이 걸리는 게 단점이였다. 이번 글에서는 그라디언트 부스팅을
보도자료 슈퍼브에이아이, 일본 AI 시장 진출 본격화… 글로벌 확장 지속 [슈퍼브에이아이 2023/4/7] 웹 기반 AI 개발 협업 플랫폼을 운영하는 슈퍼브에이아이(Superb AI)는 일본 법인을 설립하며 글로벌 확장에 속도를 낸다. 슈퍼브에이아이는 지난해 글로벌 시장에서의 성장과 파트너십 확대를 위해 일본 진출을 결정하였다. 일본은 인공지능 기술 적용과 데이터 활용에 대한 적극적인 인식과 정책 지원이 이루어지고 있으며, 다양한 산업 군에서 AI를
성공사례 [스포츠] 스포츠 산업에서 AI는 어떻게 사용 될까? : 99% 정답 데이터셋을 구축한 스포츠 투아이 100%PoC 만족도99%품질의 정답 데이터 셋 구축 기업소개 스포츠투아이는 스포츠 데이터를 전문적으로 공급하며, 경기 기록 데이터베이스 관리 및 솔루션, 시스템 서비스를 통해 보다 가치 있는 콘텐츠를 제공하는 기업입니다. 산업스포츠이용 서비스슈퍼브 데이터 서비스진행기간3개월진행목적농구 경기의 전술 분석을 위한 선수 객체 추적 및 플레이 타입의 분류 요즘 각종 스포츠 리그가 활발하게 진행
슈퍼브 팀 슈퍼브에이아이는 AI/MLOps 전문 블로그를 만들어 갑니다 안녕하세요! 마케터 Seon 입니다. 제가 슈퍼브에이아이와 함께 한지 6개월이 지났네요! 어느 직무나 그렇겠지만 이직을 하게 되면 항상 비슷한 업무환경에서 일을 시작하게 되는 것 같아요. (같은 직무로 이직하면 더더욱요.) 해서 이직 후 나름의 업무 우선순위를 정하고 순차적으로 진행하는 습관이 생겼고, 가능한 기존의 업무 범위를 벗어나 새로운 도전을 하기 위한 업무 로드맵을
AI 인사이트 ChatGPT는 영혼을 가질 수 있을까?: 인공지능으로 풀어보는 인문학 작년 여름, 구글의 엔지니어 블레이크 레모인이 자사의 대화형 인공지능 '람다(LaMDA)'가 사람처럼 '지각 능력'을 가지고 있다는 주장을 했다는 뉴스로 세상이 떠들썩해졌다. 그의 말에 따르면 구글의 대화형 초거대 언어모델(LLM)인 람다는 인간처럼 사고할 수 있으며 작동이 정지되는 것, 즉 죽음에 대한 두려움을 느끼고 있다고