저널 임베딩을 활용한 피처 엔지니어링: ML 엔지니어를 위한 실무 가이드 ‘임베딩을 활용한 피처 엔지니어링: ML 엔지니어를 위한 실무 가이드’는 빠르게 진화하는 머신러닝 세계에서 임베딩을 사용한 피처 엔지니어링의 필수 작업에 대한 실용적이고 포괄적인 접근 방식을 다룹니다. ML 엔지니어는 모델의 성능 개선을 위해 끊임없이 노력하지만, 로우 데이터에서 유용하면서 인사이트가 있는 특성을 추출하는 과정은 한결같이 어려운 과제로 여겨지고 있습니다. 이 포스트를 통해
AI 인사이트 안면 인식 AI 기술 알아보기: 편리함과 인권 침해 사이 안면 인식 (Face Recognition) Face recognition(안면 인식)은 인물의 얼굴을 감지하고, 얼굴의 고유한 특징과 패턴을 분석하여 개인을 식별하는 기술입니다. 안면 인식 기술은 주로 두 사진 속 인물 간의 동일인 여부를 검증하거나, 이미지 속에 있는 인물이 내부 데이터베이스에서 식별되는 사람인지를 확인하는 데 사용됩니다. 우리에겐 스마트폰의 잠금을 해제할 때 사용하는 기술(
저널 ML 프로젝트별 최적의 데이터 어노테이션 타입을 선택하는 방법 머신러닝이나 컴퓨터 비전 모델을 만드는 것은 어느 팀에게나 힘들고 귀찮은 일입니다. 특히 처음이라면 고난의 연속일 수 밖에 없죠. 하지만 시작이 반이라고, 어디서부터 시작해야 하고 어떤 라벨링 타입을 채용할지 결정하면 반은 온 것이나 다름 없습니다. 프로젝트를 어떻게 진행할지는 이 프로젝트에 얼마나 많은 디테일, 예산, 데이터, 시간이 필요한지에 따라 완전히 달라집니다. 그리고
AI 인사이트 클라우드(Cloud), 도구에서 핵심 전략으로: 클라우드 이제는 선택이 아닌 필수 2006년 아마존(Amazon)이 강력한 자사 인프라를 바탕으로 AWS(Amazon Web Service)를 설립하고 IaaS(Infrastructure as a Service) 형태의 클라우드를 제공하기 시작한지 10여년이 넘는 시간동안, 기업들은 클라우드를 가상화된 서버, 스토리지, 네트워크 등의 자원을 활용하여 서버 구축 비용을 절감하기 위한 하나의 IT 도구 정도로 여길 뿐이었다. 예외적으로 아마존(Amazon)이나
AI 인사이트 인공지능을 어디까지 믿어야 할까?: 블랙박스 모델과 데이터 편향 우리 생활 속의 인공지능 인공지능은 여지껏 본 적 없는 방식으로 전 세계 60억 인구의 삶을 연결시키고 있다. 예를들어 오늘 본 유튜브 추천 영상은 나 한 사람만의 취향이 반영된 것이 아닐 가능성이 크다. 유튜브의 영상 추천 시스템은 나 자신의 개인정보와 검색이력 뿐만 아니라 전 세계에서 나와 비슷한 연령, 성별, 직업군의 사람들이
AI 인사이트 딥러닝의 발전과 NLP(자연어 처리) 더딘 기술발전과 실효성에 대한 의문으로 ‘빙하기’를 거치고 있던 인공지능 기술은 2010년대 중후반 딥러닝(Deep Learning) 기술의 발전 덕분에 제2의 전성기를 맞이하게 된다. Resnet을 비롯한 CNN(Convolutional Neural Network)의 발달로 주목받게된 이미지처리(Image Processing) 분야는 업계와 산업을 막론하고 다방면에서 활용되는가 하면, 금융 업계의 퀀트(Quant)들이 RNN(Recurrent Neural
AI 인사이트 어떤 질문을 던질 것인가?: ChatGPT 프롬프트 엔지니어링 가이드 인간과 대화하며 업무에 도움을 주는 인공지능이 생기는 걸까? ChatGPT에 이어 텍스트를 넣으면 이미지를 생성해주는 DALLE2나 Stable Diffusion과 같은 텍스트 투 이미지 모델, 또한 텍스트를 넣으면 동영상을 만들어 주는 텍스트 투 비디오 모델 등 다양한 생성형 AI 모델이 나오고 있다. ChatGPT와 같은 생성형 AI 모델에 입력하는 사람의 질문 또는 지시와 같은
AI 인사이트 DeepL이 AI 번역 강자로 떠오르는 이유: 치열해지는 AI 번역 시장 번역AI의 결과가 다른 이유 영어를 배우면 배울 수록, 번역기의 결과가 아쉽다는 생각이 자주 들고는 합니다. 저는 주 3회 전화 영어를 하는데, 표현이 떠오르지 않을 때는 Papago를 이용하는데 정말 편하지만 가끔은 부자연스러워요. (구글 번역은 안 쓴 지 꽤 됐구요) 여러분들은 어떠신가요? 번역기를 자주 쓰시나요? 오늘은 대표적인 번역툴 Papago와 DeepL에 대해 집.
슈퍼브 팀 AI EXPO KOREA 2023을 준비하며 : 산업 특화 전시회 참석의 장점 지난 5/10~12일 간 코엑스에서 진행된 AI 엑스포는 제가 슈퍼브에이아이에 온 이후로 진행한 첫 대규모 전시회였습니다. 몇 년 전 참석했던 AI 전시회 대비 커진 전시장과 더불어 엄청난 방문객 인파에 놀라기도 했지만, AI 기술 분야에서 선두를 달리고 있는 다양한 기업들이 참가해 글로벌 AI 시장 동향을 확인할 수 있는 의미 있는
슈퍼브 팀 5주년, 그리고 다시 출발선에 선 슈퍼브에이아이 5년 전, 인공지능 개발의 장벽을 허물기 위한 다섯 명의 도전으로 시작했던 팀이 현재는 한국, 미국, 일본 3개 국가의 100여 명의 구성원들이 함께하는 팀으로 급격히 성장하였는데요. 지난 4월 All-hands 미팅은 슈퍼브에이아이의 성장을 함께 이끌어 온 구성원들과 5년을 돌아보는 의미 있는 시간으로 진행되었습니다. 2018년 첫 시작을 기억하며 최근 어려운 시장 상황에서도 5주년
저널 애그테크(AgTech) 컴퓨터 비전을 위한 데이터 소싱 가이드 전통적인 산업 농업 방법은 식량 생산뿐만 아니라 기타 원자재를 관리하고 제조업체에 공급함으로써 생계를 유지하며 글로벌 공급망과 경제에 크게 기여하고 있습니다. 이러한 광범위한 영향력을 고려하면, 이러한 기존 방식은 세계 각지에서 변화하는 시장 수요에 발맞추기 위해 혁신적으로 변화하고 있습니다. 농업 업계가 이러한 수요를 충족하기 위해 계획하고 있는 방법에는 머신러닝(ML) 및 컴퓨터
저널 컴퓨터 비전 데이터 큐레이션을 위한 임베딩의 미래 머신러닝에서 임베딩의 개념은 주성분 분석(PCA) 및 다차원 스케일링(MDS)과 같은 기술의 개발과 함께 2000년대 초반으로 거슬러 올라갑니다. 이러한 방법은 고차원 데이터 포인트의 저차원 표현을 찾는 데 중점을 두어 복잡한 데이터셋을 보다 쉽게 분석하고 시각화할 수 있도록 했습니다. 컴퓨터 비전에서 이미지 임베딩 개념은 2010년대 초 딥러닝 기술의 부상과 함께
보도자료 슈퍼브에이아이, ‘AI EXPO KOREA 2023’ 참여 성료… 자동 데이터 선별 AI ‘슈퍼브 큐레이트’ 호평 [슈퍼브에이아이-2023/05/16] 슈퍼브에이아이는 국내 최대 규모의 AI 전문 컨퍼런스 'AI EXPO KOREA 2023 국제인공지능대전'참가를 성공적으로 마쳤다고 밝혔다. 지난 10~12일간 코엑스에서 개최된 본 컨퍼런스는 국내외 AI 기업과의 네트워킹을 확장하고 참가기업과 참관객 간 인공지능 기반의 산업 혁신 및 발전 방향에 대한 다양한 의견과 아이디어 교류가 이루어졌다. 이번
AI 인사이트 인공지능(AI)의 정답은 데이터에 있다 인류가 2000년대 초반부터 2023년 현재까지 생산한 데이터의 양은 90 제타바이트(ZB)에 달한다고 한다. 이는 고대인류가 파피루스와 같은 원시적인 형태의 종이에 기록을 남기기 시작한 이후, 약 5000년이라는 시간동안 쌓아온 데이터양의 약 3000천배가 넘는 수치다. 천문학적이라는 말로는 데이터의 무서운 증가세를 표현하지 못할 지경이다. 이 글을 쓰고있는 지금 이 순간에도 수많은 사람들은
AI 인사이트 AI는 의료 진단에 어떻게 사용될까?: 의료진의 제 3의 눈과 귀 AI 의료 진단 보조 시스템 의료 업계에서도 AI 기술은 뜨거운 감자입니다. 의료 AI는 인공지능 기술을 의료 분야에 적용하여 환자 진단, 예방, 치료, 의료 정보 관리 등 다양한 분야에서 의료 전문가와 환자를 지원할 수 있습니다. 지금도 의사의 진단을 보조하기 위해 또는 환자의 자가 진단을 위해 객체 검출, 세그멘테이션, 시계열 데이터 분석,
AI 인사이트 인공지능과 디스토피아 AGI(인공일반지능) 인공지능이 만들어낼 디스토피아를 상상하면서 우리는 영화 '터미네이터'를 떠올리곤 한다. 기계가 스스로 판단하여 사람들을 지구의 악성 바이러스로 규정하고 처분하기까지 하는 폭력적이고 끔찍한 장면 말이다. 그러나 자연어처리(NLP) 분야의 프로젝트에서 직접 일하면서 느낀 현실은 공상과학 영화와는 매우 다른 것이었다. 작년 말 챗GPT의 등장으로 사람들은 기계의 위협이 더이상 먼 미래의
AI 인사이트 단어를 숫자로 바꿔 학습하는 방법 - 임베딩에 대한 이해 ChatGPT와 같은 AI 언어모델이 어떻게 사람의 말을 하는 지 궁금한 적이 있는가? 최근 핫한 ChatGPT가 사실 숫자로 입력된 정보를 요리조리 뜯어보고 사람의 말을 내뱉는 것이라면? 머신러닝 라이브러리를 사용해 보신 경험이 있는 분이라면 알겠지만 테이블로 정리된 데이터를 바로 머신러닝 라이브러리에 집어 넣을 수는 없다. 텍스트는 반드시 모두 숫자로 바꿔 입력해야 하는
저널 컴퓨터 비전용 데이터 구성을 위한 임베딩 생성하는 법 알아보기 컴퓨터 비전 분야에서 엔지니어와 데이터 사이언티스트는 방대한 양의 이미지 데이터를 이해하고 정리해야 하는 어려운 과제에 직면해 있습니다. 고성능 컴퓨터 비전 모델에 대한 수요가 계속 증가함에 따라 대량의 비정형 또는 로우 데이터를 효율적으로 처리하는 것이 점점 더 중요해지고 있습니다. 로우 데이터를 기계가 이해하고 활용할 수 있는 정형화된 형태로 변환하는 작업은 데이터
보도자료 슈퍼브에이아이, 국제인공지능대전 ‘AI EXPO KOREA 2023’ 참가 [슈퍼브에이아이-2023/05/12] 인공지능(AI) 기반의 머신러닝 데이터 학습 플랫폼을 제공하는 슈퍼브에이아이가 ‘AI EXPO KOREA 2023’(국제인공지능대전)에 참가한다. 슈퍼브에이아이는 이번 ‘AI EXPO KOREA 2023’ 참가를 통해 최근 정식 출시한 제품인 ‘슈퍼브 큐레이트(Superb Curate)’데모 시연과 함께 AI 도입·개발·고도화 등에 대한 무료 컨설팅을 진행할 예정이다. 슈퍼브에이아이 관계자는
제품 및 서비스 MNIST 데이터셋 테스트로 알아보는 슈퍼브 큐레이트 큐레이트를 소개합니다 데이터는 머신러닝의 근간입니다. 머신러닝 모델을 효과적으로 훈련시키기 위해서는 잘 정리된 폭넓고 정확한 데이터가 필요합니다. 그러나 데이터를 수집하고 큐레이션하는 데는 많은 시간과 비용이 소요되며, 종종 시간과 비용, 인적 자원에 대한 상당한 투자가 필요합니다. 큐레이트(Curate)는 머신러닝 팀이 데이터 큐레이션 프로세스를 간소화하여 프로세스를 더 빠르고 효율적이며 경제적으로 만들 수
저널 컴퓨터 비전 데이터 큐레이션을 위한 이미지 임베딩이란 무엇인가요? 머신러닝(ML) 및 컴퓨터 비전(CV) 개발자는 주변 사물의 미세한 차이를 인식하는 사람의 능력을 모델로 구현하기 위해 노력합니다. 여기서 궁금해지는 것은 기계가 주변 환경의 사물을 정확하게 식별하도록 어떻게 훈련시킬 수 있을지입니다. 신경망이나 ML 모델에서 일정 수준의 일관된 성능을 달성하는 것과 마찬가지로, 그 해답은 모델 훈련에 사용된 데이터에 있습니다. 일반적인 모델로
AI 인사이트 초거대 언어모델(LLM)과 인간의 두뇌: 딥러닝과 인간의 뇌 그리고 튜링테스트 클라우드 컴퓨팅 기술의 발전과 데이터의 증가로 초거대 언어모델(Large Language Model)이 가용할 수 있는 학습 데이터가 기하급수적으로 늘어나면서 성능이 점점 정교해지고 있다. 이러한 트렌드를 반영하듯 인공지능 업계에서는 ChatGPT는 거대한 변화의 서막일 뿐이라고 보는 견해가 많다. 올해 OpenAI가 공개한 GPT 시리즈의 최신버전 GPT-4.0에는 이전 버전의 1750억개를 아득히 뛰어넘는 약
AI 인사이트 텍스트 검출 및 인식 - 아날로그의 디지털화를 위해 텍스트 검출 및 인식 (Text Detection/Recognition) 텍스트 검출(Text Detection) 및 텍스트 인식(Text Recognition)은 디지털 이미지나 비디오에서 텍스트를 검출하고 인식하는 기술로 흔히 OCR(Optical Character Recognition)이라고도 불립니다. 이러한 텍스트 검출 및 인식 기술은 객체 검출(Object Detection)의 한 분야이며 영상에서 텍스트만을 추출하고 인식합니다. *편의상 텍스트
보도자료 슈퍼브에이아이, 자동으로 균형 잡힌 데이터셋 생성해 주는 '슈퍼브 큐레이트' 신규 출시 [슈퍼브에이아이-2023/04/27] 머신러닝 데이터 관리 플랫폼 기업 슈퍼브에이아이가 자동 데이터셋 생성 기능을 제공하는 ‘슈퍼브 큐레이트(SUPERB Curate)’를 정식 출시했다고 밝혔다. 슈퍼브 큐레이트는 머신러닝 팀이 손쉽게 훈련용 데이터셋을 구축하여 더 강건하고 높은 성능의 모델을 구현할 수 있도록 하는 혁신적인 데이터 큐레이션(Curation; 양질의 데이터를 취합, 선별, 분류, 구조화하는 것)
AI 인사이트 기업들이 ChatGPT 도입을 망설이는 이유: 딥러닝의 발전 과정과 한계극복 작년말 시작된 챗GPT 열풍으로 ‘생성형 AI’의 전성시대가 이어지고있다. 생성형 AI의 등장으로 그동안 인간 고유의 것이라고 생각했던 지식노동과 창작의 영역이 얼마나 손쉽게 인공지능에게 넘어갈 수 있는지를 목격한 사람들은 흥분과 망상의 도가니에 빠지거나 혹은 절망감과 무력감에 허덕이고있다. 대중의 반응을 보면 마치 생성형 AI 전에는 인공지능이 존재하지 않았으며, 생성형 AI가 곧 인공지능을