인공지능과 디스토피아 AGI(인공일반지능)
인공지능이 만들어낼 디스토피아를 상상하면서 우리는 영화 '터미네이터'를 떠올리곤 한다. 기계가 스스로 판단하여 사람들을 지구의 악성 바이러스로 규정하고 처분하기까지 하는 폭력적이고 끔찍한 장면 말이다. 그러나 자연어처리(NLP) 분야의 프로젝트에서 직접 일하면서 느낀 현실은 공상과학 영화와는 매우 다른 것이었다.
작년 말 챗GPT의 등장으로 사람들은 기계의 위협이 더이상 먼 미래의 일이 아님을 깨닫게 되었다. 그러나 약인공지능(weak ai)으로 분류되는 현재 인공지능의 추론 및 예측 능력은 여전히 자연어 처리, 음성인식, 이미지 분류 등 각각의 분야에 한정되어 있다. 용도 또한 고객을 응대하는 챗봇을 만들고, 업무를 효율화하고 서비스 절차를 간소화 하는 등 인간의 편의성에 초점이 맞추어져 있다. 이 단계의 인공지능은 아직 의식을 가지지 못하며 사전 학습된 데이터를 바탕으로 주어진 명령을 처리할 뿐이다.
AGI(인공일반지능)과 디스토피아
인공지능이 '터미네이터'와 같이 스스로 판단할 수 있는 능력과 공격력을 갖추려면 AGI(Artificial General Intelligence) 즉 '인공일반지능'으로의 퀀텀 점프가 필요하다. AGI의 지적 능력은 특정 분야에 한정되지 않는다. 마치 사람처럼 사물을 보고 언어를 들으며 다양한 형태의 데이터를 받아들이며 그것을 바탕으로 종합적인 판단이 가능해 진다. 인공지능이 이 단계까지 도달하면 인간의 사고체계와 영혼을 획득하게 될 것이라고 보는 시각도 있다.
그러나 챗GPT가 놀라운 성능을 보여준다고 해서 이것이 AGI 시대가 도래했음을 의미하는 것은 아니다. AGI 개발을 위해서는 챗GPT와 같은 기존의 초거대 언어모델(LLM)과는 근본적으로 다른 접근방식이 필요할지도 모른다. 따라서 사람같은 인공 일반 지능 개발을 위해서 앞으로 10년이 걸릴지 20년이 걸릴지 혹은 그 이상이 걸릴지 아무도 장담하지 못한다.
결론적으로 인공지능이 가져다줄 디스토피아는 앞으로도 상당기간동안 공상과학영화속 이야기로만 존재하게 될 가능성이 크다. 하지만 아직 안심하긴 이르다. 인공지능은 우리가 전혀 생각해본 적 없는 방식으로 영화보다 훨씬 무서운 디스토피아를 초래할 가능성을 배제할 수 없기 때문이다.
권력의 집중과 인본주의의 종말
유발 하라리는 그의 저서 '호모데우스'에서 다가올 미래의 모습이 인간 중심의 민주화된 현대 사회와는 거리가 멀며, 오히려 소수의 초엘리트 집단에게 모든 권력과 권한이 집중된 독재 사회에 가까운 모습일지 모른다고 경고한다. Google이나 OpenAI같은 소수의 초거대 기업에 모든 데이터와 기술력이 집중되면서, 작은 기업과 개인들은 그들의 기술력에 의존할 수밖에 없게 되기 때문이다. 또한 인공지능이 발전을 거듭하게 되면서 인간 본연의 가치를 중시하는 '인본주의'의 의미마저 사라져 버린다면 대다수의 사람들에게는 최소한의 경제력도 인권도 보장되지 않는 '디스토피아'가 펼쳐질 것이라는 주장이다.
2018년 처음으로 그의 책을 읽었을 때 받았던 충격을 아직도 기억한다. 존재하는 실체로서 굳게 믿어 의심치 않던 인간의 존엄성, 자유, 의지와 같은 개념들이 사실은 허상에 불과하며 기술의 발전에 따라 얼마든지 사라져버릴 수 있다는 그의 주장은 인류 역사를 부감해보면 꽤나 설득력 있는 주장이라는 것을 알 수 있다. 인권이라는 개념이 본격적으로 확립되기 시작된 것은 17세기 부터이며, 그마저도 노예제도와 양차 세계대전을 거치면서 철저히 무시되어 오던 시기도 있었다. 굳건히 확립된지 백년도 채 되지 않은 인권이라는 위태로운 개념에 과연 우리의 미래를 맡겨도 되는 것일까?
초거대 언어모델(LLM)의 위험성
물론 유발 하라리의 경고를 터미네이터와 비슷한 공상과학 정도로 취급하는 사람들도 많다. 그가 주장하는 디스토피아는 지금 당장 인공지능이 우리에게 가져다줄 편익에 비하면 너무나 먼 곳의 이야기처럼 느껴진다. 그러나 현업에서 일을 하다 보면 그의 말이 단순히 근거 없는 허무맹랑한 주장이 아닐지 모른다는 섬뜩한 직감을 더 이상 무시할 수 없다. 실제로 대부분의 NLP(자연어처리) 프로젝트에서 활용되는 초거대 언어 모델(LLM)은 Google사 OpenAI사 등 세계 초일류 기업들이 천문학적인 액수의 자금과 긴 시간을 들여 구축해 놓은 대규모 딥러닝 모델이다.
약 33억개의 텍스트 데이터로 사전학습을 마친 언어 모델 BERT(Bidirectional Encoder Representations from Transformers)를 작은 스타트업이나 개인이 만들어 내는 것은 불가능하다. 약 1750억개의 매개변수를 가지고 있는 GPT-3 모델은 사용을 위해 훈련을 마치는 데에만 해도 약 130억원이라는 돈이 든다.
물론 이러한 기술들은 오픈 소스로 활용이 가능하기 때문에 관련 기술에 대한 어느 정도의 이해가 있으면 접근이 용이하며, 비교적 적은 시간과 노력을 들이고도 좋은 결과를 도출해 낼 수 있다는 장점이 있지만, 모델이 어떻게 그러한 결과를 도출해내게 되었는지에 대한 과정은 철저한 블랙박스로 남아있다. 그러나 업계에서 선택지는 GPT나 BERT같은 사전학습 모델로 점점 줄어들고 있다. 경제성과 성능면에서 기존의 모델과는 비교가 되지 않기 때문이다.
쉽고 빠른 컴퓨터 비전 데이터 관리
인간의 뇌를 컴퓨터에 옮겨 놓을 수 있다면
작년 말 시작된 ChatGPT 열풍이 채 가시기도 전, OpenAI사는 또 한 번 최신 언어모델 GPT-4.0의 출시를 발표하였다. ChatGPT의 모태가 된 초거대 언어모델(LLM) GPT-3.5의 수십 배에 달하는 매개변수를 가지고 있을 것으로 추정되는 GPT-4.0은 미국 변호사 시험과 대입시험 SAT 등 주요 시험에서 상위 10%에 해당하는 백분위 수를 기록했고, 사람만큼 뛰어난 언어능력을 가지고 있는 것으로 평가되었다.
또한 GPT4.0는 텍스트뿐만 아니라 사진, 영상, 소리까지 처리하는 멀티모달 시스템(multimodal system)이 탑재되어 있다. 따라서 기존의 ChatGPT를 뛰어넘어 이미지 분석이나 음성 인식과 같은 다양한 분야에 활용 가능할 것으로 보인다.
LLM이 학습하는 방식이 인간과 점점 유사해진다. 이쯤 되면 인간의 뇌를 그대로 컴퓨터에 옮겨놓는 것도 전혀 무리는 아니라는 생각이 든다. 과연 GPT-4.0의 다음에는 무엇이 우리를 기다리고 있을까? GPT-5,6,7... 기하급수적으로 늘어나는 데이터와 발전하는 기술의 끝에 컴퓨터는 결국 인간처럼 '의식'을 획득할 수 있을까? 그 날이 오면 우리 인류는 어떻게 인공지능과 우리 자신을 차별화 하고 살아남을 수 있을까? 한번쯤 고민해봐야 할 문제이다.
문과 출신으로 AI 스타트업에서 데이터 사이언티스트로 일하고 있습니다. |
* 슈퍼브 블로그의 외부 기고 콘텐츠는 외부 전문가가 작성한 글로 운영 가이드라인에 따라 작성됩니다. 슈퍼브 블로그에서는 독자분들이 AI에 대한 소식을 더 쉽고 간편하게 이해하실 수 있도록 유용한 팁과 정보를 제공하고 있습니다.