인공지능의 한계점 - ingongjineung-ui hangyejeom

여전히 한계점이 있지만 유용한 도구인 AI

[글=노규남 | 위블 CTO]

AI 전성시대

2016년 알파고가 이세돌 9단과의 바둑시합에서 4승 1패로 최종 승리하면서 사람들에게 충격을 준 이후 AI(인공지능)에 대한 관심은 계속 가라앉지 않고 있다.

아직 비즈니스 모델이 명확하지도 않은 AI 스타트업들이 대단한 규모의 금액을 투자받기도 하고, 향후 AI가 발전하여 강인공지능(Strong AI) 또는 일반 인공지능(Artificial General Intelligence, AGI)이 출현하게 되면 인간이 할 일은 없어질 거라 예측하는 사람들도 있다.

사실 이쪽 분야를 연구하는 사람들에게 AI가 인간을 능가할 수도 있다는 충격을 준 사건은 알파고 보다는 2012년의 ILSVRC(ImageNet Large Scale Visual Recognition Challenge) 대회가 먼저일 것이다.

이 대회는 ImageNet이라는 백만 개가 넘는 이미지셋을 AI 모델을 이용해 1000개로 분류하는 경연으로, 2011년 그 유명한 AlexNet이 출품되었고, 전년도 우승 모델보다 무려 10%의 성능을 향상시켜서 에러율 16%로 우승했던 건 잘 알려진 사건이다.

더욱이 마지막 대회였던 2017년 우승 모델인 SENet의 에러율은 2.3%로 인간의 5%를 가볍게 능가한다. 이때 이미 GPU를 활용한 행렬 연산, DropOut, ReLU 등 현재 사용되고 있는 다양한 성능 향상 및 최적화 기법들이 제안되었다.

또 이 시기를 기점으로 여러 분야에서 AlexNet이 채택했던 CNN(Convolutional Neural Network)이 많이 쓰이기 시작했는데, 알파고의 첫 번째 버전에서도 Policy Network와 Value Network에 CNN이 사용되었다. AlexNet은 의도하지 않게 알파고의 탄생에도 일부 기여한 셈이다.

그 후 최근에 이르러서는 주로 자연어처리(Natural Language Processing, NLP) 분야에 GPT-3 등의 초대형 모델들이 테스트되고 있는데 이런 모델들이 만들어지면서 번역, 텍스트 요약, 문서 작성 등 다양한 분야에서 사람들이 하던 일들을 AI가 급속히 대체해 나가고 있다. 그럼에도 불구하고 AI에 대한 오해는 여전히 적지 않은 것으로 보인다.

전형적인 CNN의 구조. 알파고도 Policy Network와 Value Network에 CNN을 사용하지만 마지막 단의 출력은 각각 바둑판 전체 중 다음 착수점과 현 상태에서 계산된 게임의 승률이 나오도록 구성되어 있다.(출처: 위키미디어)

AI는 모든 것을 해결해주는 마법상자가 아니다

근래 필자는 한 기업이 AI를 도입하기 위한 컨설팅을 진행한 적이 있는데, 일단 모델링을 위해 충분하고 정제된 데이터를 확보하는 것이 우선이라는 점을 설명했다.

그런데 해당 기업의 담당자는 그런 데이터가 없어도 원하는 작업을 수행해주는 것이 AI가 아닌가, 최근 기술이 매우 발달해서 비지도학습(Unsupervised Learning)이나 AutoML을 사용하면 되는 것이 아니냐는 식으로 물었다.

물론 DQN(Deep Q-Network) 등 비지도학습이 성과를 낼 수 있는 영역이 있기는 하지만 이 분야에 그런 학습 방법을 적용하기는 어렵다.

AutoML은 데이터가 없어도 학습할 수 있는 방법론이 아니라 ML을 사용하기 위한 파이프라인을 자동화하고 성능을 올리기 위한 hyper parameter를 찾아주는 작업을 해줄 뿐 머신러닝의 모든 작업을 대신해 줄 수 없다고 설명하며 납득시키고 넘어 갔는데, 모델 선택에 와서 또 다시 설명이 필요했다.

필자는 해당 데이터세트에 딥러닝을 사용할 때 얻어지는 이익이 명확하지 않으니 클래식 머신러닝 모델의 GBM(Gradient Boosted Model)을 쓰면 좋겠다고 얘기했으나 담당자는 다시 딥러닝이 모든 머신러닝 모델 중 가장 우월한 것이 아니냐, 왜 딥러닝을 사용하지 않느냐고 물었다.

이 사례는 오늘날 업계에 퍼져 있는 AI에 대한 여러 가지 오해를 잘 보여준다. 실제 AI나 ML을 직접 적용해 본 적 없는 담당자라도 알파고나 GPT-3와 같은 대형 모델들에 대해서는 많은 얘기들을 들었고, 내부 스터디나 외부 교육으로부터 일부 AI에 대한 지식을 얻기도 한다.

또 AI가 워낙 유행하다 보니 웬만한 스타트업이나 기업들도 사업계획서에 AI나 ML을 넣는다. 최근에는 대형 NLP 모델들이 각광을 받고 있어서 발표 자료에 NLP를 끼워 넣는 경우도 적지 않다.

AI를 도입하기만 하면 기업의 모든 문제가 마술상자를 연 것처럼 사라질 것이라는 비현실적인 기대를 하고 있는 것처럼 보이기도 한다. 그러나 안타깝게도 현세대의 AI는 그런 마술 상자와는 거리가 한참 멀다.

GPT-3 같은 초대형 모델들이 대단한 성과를 거둔 건 분명한 사실이나, 사람을 대체할 수 있는 강인공지능이나 일반 인공지능과는 아직도 상당한 거리가 있는 것이다.

현세대의 AI는 무엇인가

사실 지금처럼 딥러닝으로 대표되는 AI가 융성할 수 있었던 건 하드웨어 기술의 발전에 힘입은 바가 크다. 이미 인공신경망에 대한 중요한 이론들은 1980년대까지 거의 나왔지만, 당시 하드웨어 성능으로는 의미 있는 결과를 내기가 힘들었고, 생물의 신경망을 시뮬레이션 해보았다는데 만족해야 했다.

2000년대 이후 클라우드 컴퓨팅이 대세가 되고 GPU를 행렬 연산에 사용하는 아이디어가 채용되자 연구자들에게 주어지는 컴퓨팅 파워는 급증했고, 일전에 할 수 없었던 작업 방식이 시도되기 시작했다. 이런 연구가 발전하면서 영상, 음성, 번역 등 예전에는 자동화하기 불가능하다고 여겨졌던 부문에서의 AI 적용 사례가 늘어났다.

하지만 본질적인 부분을 들여다본다면 현재의 딥 뉴럴 네트워크와 클래식한 머신러닝 방법에 큰 차이가 있는 건 아니다. 뉴럴 네트워크의 한 계층은 예전부터 연구되던 Linear Regression 모델을 그대로 사용한 것이며(DNN은 이 계층을 3개 이상으로 쌓은 것이다), 타깃 값과 실제 추정치의 차이를 loss로 보고 이 loss를 줄여 나가는 방식으로 학습하는 건 Linear Regression에서 사용되던 Gradient Descent Algorithm 그대로다.

즉 컴퓨팅 파워가 늘어났을 뿐 본질적으로 본다면 독립변수들(X, features)을 주고 종속변수(y)를 추정하는 학습 방식은 전혀 달라진 바가 없는 것이다. 비지도 학습의 대표인 강화 학습의 경우도 loss를 정의하는 방법이 다를 뿐 loss를 줄여간다는 목표는 동일하다. NLP도 초대형 모델이 속속들이 만들어지고 있지만 정말로 화자 언어의 컨텍스트를 이해한 것인지에 대해서는 이견이 분분하다.

일례로 GPT-3에 태양이 몇 개의 눈을 가졌는지 물었을 때 “한 개”라고 대답한 것은 유명한 일화다. 사람이라면 태양이 생물이 아니며 당연히 눈이 없다는 상식을 가지고 있지만 GPT-3는 그런 상식이 없기 때문에 자신이 학습한 범위 안에서 확률적으로 가장 맞는다고 생각하는 답인 “한 개”를 돌려준 것이다.

따라서 좀 거칠게 표현하자면 GPT-3는 매우 강력하기는 하나 스스로 학습한 데이터의 범주 내에서 가장 그럴듯한 답을 돌려주는 확률 기계일 뿐이라고 말할 수도 있다. 반면 인간의 지성이라는 것도 그 사람의 경험과 학습에 근거하고 있기 때문에 GPT-3와 인간 지능에 어떤 차이가 있느냐는 식의 반박을 할 수도 있다.

존 설의 중국어방(The Chinese Room) 논증에 대한 갑론을박은 이 주제에 대해 아직 명확한 결론이 없다는 사실을 잘 보여준다. 하지만 GPT-3와 같은 방법으로 인간의 의식을 구현할 수 있다는 점을 긍정한다고 하더라도 엄청나게 큰 모델과 초대용량의 데이터, 오랜 학습 시간이 필요하다는 사실은 분명하다.

정리하면 최근 몇십 년간 AI의 발전은 눈부실 정도지만, AGI를 구현하는 일은 여전히 요원하며, 앞으로도 연구되어야 하는 내용은 매우 많다. 우리는 스스로의 지능이 어떻게 작동하는지에 대해서 여전히 잘 모르고 있는 것이다.

중국어방. 중국어를 전혀 모름에도 불구하고 중국어에 대한 완벽한 답변을 제출할 수 있다면 이 사람은 중국어를 이해한다고 봐야 할까? 그렇지 않다고 봐야 할까?(사진: pxfuel.com)

AI가 할 수 있는 일은 무엇인가

하지만 그렇다고 해서 작금의 AI 열풍이 모두 과장된 것이며 실효성이 없다고 말하기는 어렵다. 당분간 AGI의 구현이 어렵다고 하더라도 특정 부문에서 잘 훈련시킨 AI는 사람이 하는 반복 작업을 많이 줄여줄 가능성이 높은데, 이는 실제 비즈니스적인 이익으로 이어질 수 있기 때문이다.

이미 이미지 인식 부문에서 AI의 성능은 사람의 수준을 넘었고, 기계 번역도 예전보다 훨씬 매끄럽다. 굳이 AGI를 구현하지 않더라도 특정 영역에서 특정한 업무만을 수행하는 AI는 전보다 더 지능적으로 작동하면서 사람의 일을 상당히 덜어줄 수 있다.

음성의 텍스트 변환, 문장 요약, 문서의 감정 분석, 번역 등이 그런 일로, 다소의 오류는 허용할 수 있으며 반복되는 사람의 일을 대신해주는 분야다. 이런 부문에서는 특화된 AI가 성과를 낼 수 있으며 생산성을 높이는데 기여하겠지만 최종적으로 내용을 다듬거나 결과를 보고 의사 결정하는 영역은 아직까지 인간의 개입이 불가피하다. 따라서 이때 AI의 역할은 사람을 도와서 효율을 올리는 일이 될 것이다.

또한 AGI가 아닌 이상 사람이 할 수 없는 건 AI도 할 수 없다. 다만 사람이 하는 일을 AI에게 맡긴다면 AI는 더 빠르고 정확하게 지치지 않고 그 일을 할 수 있기 때문에 성능을 더 올릴 수 있을 것이다.

알파고가 정상급 프로 기사들을 꺾은 것은 분명 놀라운 일이다. 하지만 그 기작을 좀 심하게 단순화하여 설명한다면 알파고는 정신이 아득할 정도로 많은 판의 바둑을 두면서 얻은 경험으로부터 확률적으로 승리할 가능성이 높은 수를 놓는 작업을 반복하고 있다고 말할 수 있다.

만약 사람이 비슷한 정도로 많은 바둑 경기 경험을 갖게 된다면 알파고와 유사한 정도의 기력을 얻을 수 있을지도 모르겠다. 하지만 사람은 단기간에 그렇게 많은 경기를 치를 수 없으므로 알파고와 같은 학습 방법은 불가능하다.

따라서 사람이 암산하는 것보다 엑셀이나 계산기를 사용하는 것이 효율적이듯, 반복할 수 있는 작업은 AI에 맡기는 것이 옳다. 이제 그 가능성이 엿보았을 뿐이므로 앞으로 AI가 사용되는 범위는 점점 넓어질 것이다.

AI의 미래

결론적으로 AGI는 아직 우리 손에 닿기에는 거리가 있으며 당분간 AI가 사람의 일을 다 대체하기도 힘들다. 지금의 AI는 이전에 없었던 강력한 컴퓨팅 파워를 사용할 수 있게 된데 많은 부분을 기인하며 높은 연산력을 얻게 된 데이터 사이언티스트들이 다양한 실험을 하면서 발전했다고 보는 것이 타당하다.

물론 CNN이나 RNN, LSTM, GRU, Transformer 같은 새로운 구조가 제안되면서 한 개 층 Perceptron만으로 학습하던 예전에 비해 AI가 할 수 있는 일들은 많아졌다.

그러나 근본적으로 Linear Regression로부터 이어진 loss를 최소화하여 목표에 근접하는 방식의 학습은 변하지 않았기 때문에 우리는 여전히 특정 업무 범위 내에서만 AI를 사용하고 있으며 새로운 업무를 적용할 때마다 재학습은 불가피하다.

이것은 현세대 AI의 한계라 할 수 있다. 이런 한계가 있어서 AI는 세 번째 겨울을 맞을 것이라는 전망도 있으나 이전 두 번의 겨울과 다른 점은 AI의 적용이 실제로 사람들에게 이득이 되고 있다는 점이다.

그런 면에서 앤드류 응 교수가 말한 바 AI는 두 번의 겨울 이후 영원한 봄을 맞았다는 말 역시도 사실일 것이다. 앞으로도 AI 영역에서 기회를 찾는 기업들은 많을 것이며 AI가 적용될 수 있는 영역도 무수히 많다.

다만 AI가 모든 것을 해줄 수 있다는 태도도 곤란하고 AI가 무용지물이라는 태도 역시 곤란하다. AI가 많은 일을 할 수 있는 건 분명하며, 예전보다 대단히 우수한 수준까지 발전한 것도 사실이지만 AI에 비현실적인 기대를 하기보다는 인간의 일을 도와주는 도구라는 점에서 실용주의적으로 접근하는 것이 타당하다.

목적 없이 유행을 좇아 AI를 도입하기보다는, 본인 도메인에서 AI를 적용할 수 있는 부분이 어디인지를 먼저 판단하고 사람의 일을 줄여준다는 취지에서 접근하는 것이 AGI가 나오기 전까지 AI를 사용하는 모범적인 방식일 것이다.