구글 딥마인드, 바둑으로 인간에 도전하다
상태바
구글 딥마인드, 바둑으로 인간에 도전하다
  • 정환용 기자
  • 승인 2016.05.03 09:54
  • 댓글 0
이 기사를 공유합니다

인간과 인공지능의 대결

바둑에서 나올 수 있는 경우의 수는 10의 170승이라고 한다. 어마어마한 수치다. 영국의 인공지능 연구소 ‘딥마인드’를 인수한 구글은, 인공지능 바둑 프로그램 ‘알파고’를 공개하고 세계적인 바둑 천재 이세돌 9단에 도전장을 내밀었다. 세계의 이목이 서울 종로에 집중됐다.

대회 전날 열린 기자간담회에는 300명이 넘는 국내외 기자들이 모여들었다. 이세돌 9단은 자신 있다고 했고, 알파고의 개발자 데미스 하사비스는 승률을 반반으로 점쳤다. 경기장을 찾은 에릭 슈미트 구글 회장은 “어느 쪽이 이기든 인간의 승리”라고 했다. 흥미진진한 세기의 대결에 세르게이 브린 구글 창립자도 서울을 찾았다.

수많은 사람들이 이 대국의 결과를 예측했다. 혹자는 이세돌 9단이 많아야 1경기만을 내주고 이길 것이라 했고, 누군가는 알파고가 유럽의 판후이 2단처럼 5:0 낙승을 거둘 것이라고도 했다. 네티즌들은 장난삼아 알파고가 영화 터미네이터의 스카이넷처럼 될 것이라며 재미있는 만화를 그리기도 했다.

그리고 1국이 끝났을 때, 바둑계가 뒤집혔다. 많은 해설자들은 말을 잇지 못했고, 딥마인드 관계자들은 조용히 환호했다. 그저 흥미로운 이슈 정도로 생각했던 사람들은, 알파고의 활약에 집중하기 시작했다.

 

지난 3월 15일, 이세돌 9단과 알파고의 ‘구글 딥마인드 챌린지 매치’가 끝났다. 생각지 못했던 알파고의 수에 이세돌 9단은 난감해 했고, 두 번째 경기도 알파고가 불계승을 거뒀을 때는 IT 업계와 바둑계 모두 다른 의미의 충격에 빠졌다.

이 대결은 4:1로 알파고의 승리로 끝났다. 바둑을 잘 알지 못하는 기자는 경기의 결과와 기보를 공부하며 ‘체스에 이어 바둑도 컴퓨터가 승리하는 시대가 왔다’는 문장을 사용하려 했으나, 대국이 끝난 뒤 생각의 방향을 바꾸고 싶었다. 단순히 어느 한 쪽의 승리라고 결말짓기에 이 경기는 그 이상의 의미를 가지고 있다.

인공지능에 대한 반응이 모두 긍정적이지만은 않다. 대부분의 사람들은 인공지능의 등장으로 인간이 더 나은 삶을 누릴 수 있을 것이라고 생각하지만, 아직까지 예측은 할 수 없는 것이 현재 과학기술의 한계다.

체스 챔피언 개리 카스파로프를 상대로 승리를 거둔 IBM의 ‘딥블루’ 이후, 세계 체스의 인기가 급락했던 전례가 있다. 아직은 미지에 가까운 분야인 인공지능을 다룬 영화의 대부분은 그 세계관이 유토피아보다는 디스토피아에 더 가깝다.

약인공지능에 해당하는 현재의 인공지능이 SF영화 속 강인공지능이 되는 것은 인간에게 위협일 될 수도 있다고 말한 과학자들도 있다. 세계적인 석학 스티븐 호킹 박사는 “인공지능을 비롯한 과학기술의 발전이 인간에게 엄청난 위협이 될 수도 있다”고 경고했다. 무엇이 인공지능을 기다리게, 혹은 두렵게 만드는 것일까?

 

인공지능의 정의

인공지능(Artificial Intelligence, 이하 AI)은 아직 현실에서 구체화된 기술이 아니다. 우리가 AI에 대한 막연한 정의를 내릴 수 있는 것은 미디어에서 그 정보를 찾을 수 있기 때문이다.

수많은 SF 영화에서 AI에 대한 이야기를 다뤄 왔고, 명장 스티븐 스필버그는 동명의 SF 영화를 만들기도 했다. 가장 최근에는 히어로 무비 ‘어벤져스: 에이지 오브 울트론’에서 아이언맨 제작의 일등공신인 ‘자비스’가 있다.

단어 그대로, 인공지능은 사람이 만든 지능이란 뜻이다. 오래전부터 인간이 이룩하는 과학의 끝이 인공지능이 될 것이라 말하는 사람들이 많았고, 실제로 아직도 미지의 분야인 뇌에 대한 청사진이 모두 그려지면 인공지능이 가능해질 것이라고 하는 사람들도 많다.

기계가 스스로 생각하는 지능을 가지기 위해선 새로운 학습 방법이 필요하다. 이와 관련된 핵심 기술이 최근 떠오르고 있는 ‘딥 러닝’과 ‘머신 러닝’이다. 이에 대해선 지난 3월호를 참조하도록 하자.

 

이세돌9단 VS 알파고

지난 1월 말, 구글 딥마인드의 발표 이후 끊기다시피 했던 바둑에 대한 관심이 전국적으로, 그리고 전 세계적으로 되살아났다. 인간과 기계, 이종(異種) 간의 대결이어서 그 호기심이 더 컸다.

알파고는 이미 몇 개월 전 유럽에서 판 후이 2단을 상대로 5전 전승을 거둔 전적이 있었지만, 대부분의 전문가들은 이 9단의 낙승을 점쳤다. 바둑에 대해 잘 알지 못하면서 이 챌린지 매치를 제대로 해설하는 건 무리라고 판단했다.

다행히 구글이나 유튜브를 통해 많은 전문가들이 5개 대국을 알아듣기 쉽게 해설한 글과 영상들이 많으니, 자세한 대국 내용은 검색을 통해 알아보는 걸 추천한다.

 

▲ 딥마인드 챌린지 매치의 대국 방식은 중국의 룰을 따랐다. 두 기사에게 2시간이 주어지고, 이 시간을 모두 소모하면 3번의 1분 초읽기가 추가된다. 초읽기는 1분 내에 착수를 하면 시간이 리셋되지만, 1분을 모두 사용하면 횟수가 감소된다. 세 번째 초읽기에서도 착수하지 않으면 패배하는 방식이다. 알파고 측에 앉은 아자 황 박사는 딥마인드의 소속 연구원으로, 알파고의 개발자 중 한 명이다. 왼쪽에 준비된 컴퓨터에 이 9단의 수를 입력하고, 알파고의 수가 나오면 그대로 바둑판에 착수하는 역할을 맡았다.

 

1국: 알파고(백) 승
승부수: 102수

3월 9일 열린 1국의 초반, 대국장의 현장 해설을 맡은 김성룡 9단이 “프로 기사라면 절대 두지 않는 수”라고 할 만한 수가 알파고에게서 2~3차례 나왔다. 몇몇 생중계를 진행하는 방송사들도 비슷한 입장이었다. 심지어 김 9단은 알파고가 생각보다 더 약하다고도 했다.

그러나 그로부터 3시간여가 지나고, 기세등등했던 해설자와 프로기사들은 일순 조용해졌다. 간절히 바랐지만, 바라지 않기도 했던 결과가 눈앞에 펼쳐졌다. 처음에 ‘악수’(惡手)라고만 봤던 수들이 결국 승리를 위한 포석이었음이 속속 드러났고, 이 9단은 결국 186수만에 돌을 던지며 패배를 인정했다.

기자 역시 중반까지도 이어졌던 이 9단의 우세가 끝까지 이어질 것으로 예상했다. 아니, 믿었다. 아직은 인공지능이 인간보다 우위에 설 때가 아니라고 생각했고, 한편으로는 바둑으로 인간이 지는 건 향후 20년쯤 뒤에나 가능할 것으로 생각했다.

3시간 40분여 경기가 끝난 뒤 이 생각들이 뒤집혔고, 혼란스러웠다. 정말로 기계가 바둑이라는 고차원적 두뇌싸움에서 인간을 이긴 것인가? 스카이넷은 영화를 넘어 영화적 예언이었을까?

 

4국: 이세돌(백) 승
승부수: 78수

2국과 3국 역시 알파고의 승리였다. 1국보다 더욱 기세등등한 차이였다. 지켜보는 사람들은 점점 불안해했다. 기계가 뛰어나다는 것보다는 기계가 ‘인간보다’ 뛰어나다는 걸 인정할 수 없다는 눈치였다. 지켜보는 사람들에게 내심 이 9단의 승리가 간절해지기 시작했다. 이 9단 역시 처음과는 달리 1승이라도 가져오겠다는 마음가짐을 보였다.

그리고 네 번째 대국에서 이 9단다운 수가 나왔다. 백을 쥔 이 9단이 둔 78번째 수였다.(사진 속 붉은색 원의 위치) 지켜보던 캐스터도, 해설자도 놀랐다. 중국의 톱 기사 구리 9단과 커제 9단도 이 수를 보고 놀라워하며 “신의 한 수”라고 했다.

그리고 이 한 수로 인해 알파고 쪽에 유리했던 판도가 일시에 이 9단의 우세로 뒤바뀌었다. 알파고는 이 수에 대한 해법으로 78수의 왼쪽 하변에 79수를 착수했으나, 이것이 실수였다는 걸 87수가 돼서야 깨닫게 된다.

 

▲ 78수에 대해 설명하자면 이렇다. 77수까지의 진행상황을 보면 알파고는 중앙 상단에 넓은 영역을 구축하고 있었다. 같은 상황에서 이 9단은 오른쪽 부분에 확실치 않은 영역을 가진 상태였다. 게다가 흑돌의 영역에는 4개의 백돌이 포로처럼 붙잡혀 있는 상태다. 여기서는 보통 71수 왼쪽의 더 넓은 길로 들어가 적당한 선에서 타협을 보고 집을 덜 내주는 것으로 마무리하게 된다. 하지만 이 9단은 포로들을 되찾겠다는 생각을 하게 되고, 71수 오른쪽의 아주 좁은 길에 78수를 둔다. 이 수로 위에 사로잡힌 포로들도 구출하고, 흑이 가지려 했던 집도 크게 줄이게 된 것이다.

 

알파고는 78수까지 보고 2개의 망 중 정책망(policy network)이 어느 곳에 착수해야 가장 유리한지를 판단했고, 그 결론이 사진에 보이는 79수였다. 그리고 가치망(value network)은 79수에 대한 승률의 판단을 절반 이상으로 예상했다.

그러나 여기서 어느 한 쪽의 실수가 나왔다.(정책망과 가치망 중 어느 쪽의 실수인지는 알 수 없다) 78수에 대응한 알파고의 다음 수는 흑을 유리하게 만들어주는 묘수가 아니었고, 오히려 백의 78수에 힘을 실어주는 카운터가 되고 말았다.

알파고는 79수에 대한 판단을 제대로 하지 못한 채 수를 이어가다가, 87수를 놓고 그 가치를 판단하고 나서야 79수가 실수였다는 걸 알아챘다. 알파고는 대국 중 끊임없이 개발진들에게 자신이 승리할 확률을 전달했는데, 줄곧 70% 이상을 고수하던 승률이 87수 이후 50% 아래로 급락했다. 아마 가치망이 78수에 곧장 대응하지 못한 것이 돌이킬 수 없는 결과를 낳았다고 판단한 것 같다. 절반 이하로 떨어진 승률은 대국이 끝날 때까지 올라오지 못했다.

이후 알파고는 거듭 이해할 수 없는 곳에 착수하며 혼란스런 모습을 보인다. 대국 중 데미스 하사비스는 트위터를 통해 “알파고가 78수에 대한 대응으로 둔 79수가 오류였다는 걸 87수에서야 알아챈 것 같다. 78수 이전에는 70% 이상이었던 승률이 87수 이후 절반 이하로 떨어졌다”고 전했다.

정수로는 이길 방법이 없다는 것을 알았는지, 알파고는 거듭되는 돌발적인 착수로 우발적인 승리를 이끌어내려 했지만, 이 9단은 끝까지 냉정했다. 결국 알파고는 ‘AlphaGo resigns’를 외치며 대리인 황 박사를 통해 돌을 던졌다. 챌린지 매치의 이 9단 첫 승이었다.

 

알파고, 최종 우승… 역사 새로 쓰다

비록 마지막 5국은 다시 알파고가 승기를 가져와 최종 스코어는 4:1로 알파고의 우승이었다. 이 9단은 대국을 마치고 홀연히 가족들과 여행을 떠났고, 사람들은 저마다 알파고와 인공지능에 대해 얘기했다. 뉴스와 다큐멘터리 뿐 아니라 예능에서도 알파고를 패러디하느라 바빴다.

‘알파고’라는 인공지능에 대한 것이 주가 아니라 ‘기계가 인간을 이겼다’는 것에 더 초점이 맞춰진 것은 좀 아쉽지만, 그래도 사람들에게 ‘머신 러닝’에 대해 대략적인 개념을 알릴 수 있어 다행이었다.

최종적으로 알파고는 대국료 15만 달러와 승리 수당 8만 달러, 우승 상금 100만 달러 등 총 123만 달러를 손(?)에 쥐게 됐다. 물론 딥마인드는 알파고가 얻은 상금을 처음의 공약과 같이 유니세프와 STEM(Science, Technic, Engineering, Mathmatics) 교육 및 바둑 관련 자선단체에 기부했다. 이 9단도 대국료와 1승 상금으로 총 17만 달러를 가져갔다.

하지만 딥마인드를 인수한 구글은 이 대국으로 A형 주가가 약 5.18%, C형 주가도 4.95% 올라 시가총액이 총 58조 원가량 불어났다. 엄청난 홍보효과를 누린 셈이니 대국을 위해 준비한 200만 달러가 전혀 아깝지 않을 듯하다.

 

이 시점에서 알파고에 대해 1국 당시와 조금 다른 생각이 떠올랐다. 농담 삼아 인간이 기계에 지배당하지 않을까 하는 생각도 했지만, 다른 시점에서 바라본 알파고의 존재는 무서워해야 하는 것이 결코 아니었다. 또한, 결국 알파고의 종착점이 약인공지능이란 것도 유추할 수 있게 됐다.

‘바둑’을 위해 태어난 알파고는, 그 자체로 인공지능이라기보다는 최첨단 바둑 기계에 더 가깝다. 물론 그 발전 가능성과 확장에 대한 기대치는 무척 높지만, 네티즌들의 농담처럼 다음 바둑 대국에서 패배한다 해서 더욱 강력한 ‘베타고’가 나올 것 같진 않다. 

알파고가 강인공지능이 되려면, 바둑을 대하는 시작점부터 지금과 확연히 달라야 한다. 가장 쉽고 빠르게 이를 설명하자면, 가만히 있던 알파고가 ‘개발자님, 스타크래프트 재미있어요?’라며 스스로 어떤 콘텐츠를 익히기 시작하는 것, 그것이 진짜 강인공지능이자 스카이넷의재림이라 볼 수 있지 않을까?

 

비슷한 이야기 - ‘Person of Interest’
이 9단과 알파고의 대국이 끝난 뒤, 문득 이와 비슷한 콘셉트의 AI가 등장했던 영화, 드라마들이 떠올랐다. 영화 ‘마이너리티 리포트’가 떠올랐고, ‘아이, 로봇’도 생각났다.

그 와중에 예전에 본 미국드라마가 생각났다. 배우 짐 카비젤과 마이클 에머슨이 주연으로 연기하고 있는 ‘퍼슨 오브 인터레스트’(Person of Interest)가 그것이다.

극중 마이클 에머슨이 연기한 해럴드 핀치와 전직 CIA 요원이었던 존 리스(짐 카비젤 分)는, 그가 만든 인공지능 시스템 ‘머신’이 주는 정보를 가지고 사람들을 구하는 일을 하게 된다. 현재 시즌 5의 방영을 앞두고 있는데, 루머에 따르면 5시즌이 마지막이 될 수도 있다고 한다.

 

드라마 속 ‘머신’과 알파고의 접점이 무엇일지 한참을 고민했다. 답은 시즌 4의 11화 ‘if then else’에 있었다.(현재 여러 방법으로 해당 에피소드를 볼 수 있고, 케이블 채널 ‘OCNseries’에서도 4시즌 방영 예정이다) 또다른 인공지능 시스템 ‘사마리탄’의 함정에 빠진 주인공 일행을 구하기 위해, ‘머신’이 약 13초의 시간 동안 수많은 연산과 시뮬레이션으로 가장 생존 확률이 높은 행동을 추천한다는 것이 대강의 줄거리다.

이 에피소드에서 ‘머신’과 알파고의 비슷한 점을 찾을 수 있었다. 알파고는 정책망과 가치망으로 대상을 판단하는데 이것이 바둑을 넘어 실제 상황으로 확장된 것이 ‘머신’이다. ‘머신’은 4명의 주인공들을 가장 안전하게 탈출시키기 위해, 도움을 요청하는 “Little help, please…”(좀 도와줄래…?)란 말을 듣고 시뮬레이션을 시작한다. ‘머신’은 주인공들이 은행 지하에 잠입했을 때 이미 모든 공간과 위치에 대한 조사를 끝냈고, 도움을 요청받은 시점에서 몇 명의 적들이 어느 방향에서 다가오는지를 파악했다. 그리고 4명의 인물들이 어떻게 행동해야 모두 살아남을 수 있는지 시뮬레이션을 통해 확인해 나갔다.

13.5초가 남은 시점에서 ‘머신’은 이미 16만여 회차의 시뮬레이션을 진행 중이었다. 약 33만 번째 시뮬레이션에서 꽤 높은 확률의 경우의 수를 발견한다. 드라마를 보는 입장에선 이 방법으로 탈출하겠구나 생각했지만, 이 역시 ‘머신’의 시뮬레이션이었다. 주인공이 각자 해야 할 일을 하려고 두 팀으로 나뉘었지만 여의치 않았고, 시뮬레이션은 계속된다. 여러 차례의 테스트를 거쳐 마침내 가장 높은 확률의 경우를 찾아 네 사람 모두 탈출을 위한 엘리베이터까지 갈 수 있게 된다. 이것이 주인공들을 행동하게 만드는 알파고의 정책망 역할이다.

 

그 와중에 리스가 해럴드를 지키려 대신 총을 맞자 생존 확률이 1%까지 떨어지지만, 외부에 있던 다섯 번째 주인공이 합류하며 그 확률이 20% 이상 급상승한다. 이처럼 주인공들의 생존 확률을 연산하는 것이 알파고의 가치망이 하는 일이다. 마지막에는 돌발적인 변수로 인해 마지막에 합류한 주인공이 붙잡히고, ‘머신’은 그 몇 초간에도 89만 회가 넘도록 연산을 계속하지만 5명 모두 생존할 확률은 결국 0.00001% 이하로 떨어지고 만다.

냉정하게 판단할 필요는 없다. 알파고는 실재(實在)하는 시스템이고 ‘머신’은 드라마 속 가상의 시스템이다. 하지만 두 기계는 분명 가치 판단에 있어 비슷한 방식으로 작동하는 부분이 있다. 그 수준은 ‘머신’이 월등하다. 향후 테러리스트가 될 가해자만이 아니라 어떤 식으로든 피해를 입을 수 있는 보호대상자까지 찾아내는 ‘머신’이다. 가장 경계해야 할 것은 드라마 속 ‘사마리탄’과 이를 숭배하는 단체 ‘컨트롤’처럼, 인간이다. 인간이 인공지능에 어떤 목적을 부여하는지에 따라 최종진화형 인공지능 로봇이 ‘아이, 로봇’의 써니가 될지 ‘터미네이터’의 스카이넷이 될지 달라진다.(왠지 알파고가 바둑을 위해 태어난 것이 다행으로 느껴진다)

앞으로의 인공지능이 어떤 방향으로 발전하게 될지, 머신 러닝의 수준이 얼마나 향상될지 지켜보는 것은, 마블의 시네마틱 유니버스 영화들을 기다리는 것만큼이나 재미있는 일이 될 것 같다. 만약 계속되는 기술의 발전으로 지금의 약인공지능이 아니라 강인공지능까지 발전할 수 있게 된다면, 아마 기대보다는 걱정을 더 많이 해야 하지 않을까?


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.