오늘 화나는 뉴스 하나를 보고 이 글을 올린다.
뉴스
정말 내용을 보면, 주장이 터무니 없는 이야기임을 IT 업자들은 알 수 있을 것이다.
뉴스의 주장은 이것이다.
"구글은 바둑의 모든 경우의 수를 비교하는 프로그램을 사용하기 때문에, 이세돌 9단이랑 경기가 될 수 없다. 그리고 앞서 말한 방식이기 때문에 해당 프로그램(알파고)는 '인공지능이 아니다.' 그래서 구글이 전 세계를 대상으로 '사기'를 친다."
거기에 대한 근거는 다음과 같다.
1. 1200개의 CPU와 176개의 GPU을 사용하기 때문에 1:1의 경기로써 맞지 않다.
특히, 네트워크 통신을 하기 때문에 클라우딩 컴퓨팅을 하여, 1:1 경기에 맞지 않다.
2. 브루드포스(Brute Force;무차별 대입방법)을 사용하기 때문에 바둑의 모든 경우의 수를 가지고 푼다. 이것은 모든 정수들을 다 보고 두는 것이기 때문에 컨닝이다.
윗 근거가 IT 업체 즉, 프로그래밍 하는 사람들로써는 정말 말도 안되는 억지 주장이다. 라는걸 알 수 있다.
그리고 초 1~중 3 까지 바둑을 취미삼아서 뒀던 한 명의 인간으로 이해가 되지 않는다.
정말, IT 전문 변호사. 라는 말이 무색할 정도로 졸자스러운 발상이다.
해당 변호사는 웃긴게, 페이스북 스타가 되었다. 라면서 자랑질까지 했다. (이메일은 동일하다.) 이것은 아직 제대로 된 정보가 아니다. 그래서, 취소선을 취하겠다.(하지만, 이메일은 동일하다.)
(2016-03-12 12:50에 추가)
해당 변호사의 경력이 올라와있는 사이트가 있길래 봤는데, 클라우드 시스템(저장형태)와 인터넷 통신, 1999년도에 C++ 마이크로 소프트로 공부했을 정도일 뿐이다.
즉, 소프트웨어의 이해가 깊은게 아니라 법률이 깊은 사람이다. 그런 사람의 주장에 속고 있는거다.
그리고 이 주장이 기사로 나오면서 엄청 공감하는 사람들이 많다는 점에서 탄식을 표하게 되었다.
윗 주장에서 중요 포인트는
구글이 전 세계에게 사기를 친다./알파고가 인공지능이 아니다./바둑의 모든 수를 구글 클라우드에 다 저장 되어 있다./클라우드 네트워크를 사용해선 안된다.
먼저, 클라우드 시스템을 사용해선 안된다. 라는 말은 웃긴 말이다.
하드웨어로서 CPU는 클라우드 시스템을 사용하지 않고는 슈퍼 컴퓨터를 만들 수 없다.
IBM의 Deep Blue는 가능했지 않느냐? 라고 말한다면, 지금의 슈퍼 컴퓨터와 Deep Blue는 차원이 다르다. Deep Blue는 최상의 하드웨어를 제작하여 연산 속도를 만들어 낸 기기이다.
정말 단일 슈퍼 컴퓨터. 라고 칭해도 될 것이다.
하지만, 여기서 알아야 될 것은 하드웨어의 발달이다.
CPU의 발달이 정확하지만, 이게 점점 빠르게 발전해 나가는 중의 컴퓨터이다.
하지만, CPU의 발달은 점점 늦춰짐이 보여졌다.
다음은 CPU의 Hz(처리 속도)를 그래프로 나타낸 것이다.
윗 그래프에서 CPU의 발전 상태를 보면, 알 수 있을 것이다.
딥 블루가 나온 시기는 1996년초이다.
보면, CPU가 점점 극진적인 발전이 보이기 시작한 시기이다.(이때도 Deep Blue는 엄청난 CPU연산을 위해서 수십개의 CPU을 박아둔 단일 슈퍼 컴퓨터였다. 즉, CPU가 많아서 반칙이다.는 Deep Blue에 조차도 적용해야지 맞는 말인 것이다.)
하지만, 2000년 이후의 CPU의 발전 상황을 봐라.
점점 10GHz이하(약, 4.4GHz가량에서)에서 점점 수렴해 나가는 것 처럼 증가폭이 점점 떨어진다.
이 이유는 물리적 제약 때문에 그렇다.
전문적 용어는 'Power Wall'(전력 장벽)이라고 한다.
이것은 쉽게 말해서 소비 전력과 발열량 증가에 의해서 더이상 전기적 효과를 내기가 어렵다. 라는 것이다.
그렇다 연산코어 증가(멀티 코어의 시작)가 되었다.
괜히, 멀티 코어가 된게 아니라는 말이다.
하지만, 이 멀티 코어도 문제가 되는 점이 있다.
문제는 CPU의 복잡성이다. 코어를 늘리기엔 CPU 디자인이 엄청 복잡하게 되어 버린다.
그 뿐만이 아니다. CPU 디자인에 따른 제작 단가의 증가. 컨트롤의 복잡함. 등... 들여야 되는 비용이 엄청나다. 거기다, 그렇게해서 빨라지면 이득이지만, 별 차이가 없다.
프로그램에 따라선 CPU0가 다 먹어 치워 버려서 프로그램이 버벅거리는 걸 볼 수 있었을 것이다.
즉, 컨트롤 및 그런 것이 속도의 문제가 엄청난 장애를 가지게 되버렸다.
이걸 타파하기 위해서 나온 방법 중 하나가 클라우딩 네트워크(병렬 처리 네트워크)이다.
이것은 아주 간단하다. CPU의 제약이 물리적인 이유라면, 처리할 데이터들을 나눠서 처리하면 되지 않겠는가?
이것이 병렬처리 네트워크의 목적이다.
그래서 CPU를 1개씩 가지는 컴퓨터 2대 이상을 가지고 네트워크에 연결해서 서로 통신하면서 병렬 처리하는 것이다.
이 병렬 처리를 통하여 연산 속도를 비약적으로 올릴려고 꽤한 것이다.(네트워크 통신이 좋아야되며, 여전히 남는 병렬 처리에 따른 컨트롤, 네트워크 통신에 따른 병목 현상 등 단점은 존재한다.)
()에 말한 단점 때문에 처리하는 속도가 아무리 해도 많이 안 늘었다.
그래서 최근에 떠오르는게 있는데, 그것은 바로 GPU이다.
GPU는 CPU와 다르게 엄청난 코어를 가지고 있다.(단, 실수 처리하는 코어는 싼 GPU에선 없다 싶이 한다.)
그래픽 처리는 엄청난 연산이 필요한 것이다.
특히, 엄청 픽셀이 많을 수록 엄청난 연산이 필요하다.
하지만, GPU는 그걸 처리한다. 이유는 미친 듯한 코어수. 거기에 맞춰진 각각의 메모리.들이다.
이게 가능한 것은 솔직히 CPU가 비싼 이유는 실수 처리, 명령어 처리이지만, GPU는 정수연산 처리만 있고, 명령은 CPU에 받는다. 대충 그런식의 형태이기 때문에 GPU는 미친 듯한 코어량을 발휘한다.
그래서 앞서 말한 클라우드 네트워킹/수십개의 CPU/수백개의 GPU가 있다고 해서 문제가 없다.
왜냐? 그것은 전부 다 연산속도를 위한 것들이기 때문이다.
그러면, 1.의 근거와 클라우드 네트워크를 사용해선 안된다. 라는 말이 정말 터무니 없다는 걸 알 수 있다.
그냥 연산 속도를 높이기 위해서 그렇게 한걸 가지고 씨알도 먹히지 않는 글은 최대한 조심히 적어야 된다는 뜻이다.
웃긴 이야기는 2.의 근거이며, 그래서 알파고가 인공지능이 아니며, 바둑의 모든 수는 클라우드에 다 저장 되어있다. 라는 것이다.
정말 웃음만 나온다. 정말 나의 감정을 표현하는 그림을 올리고 싶지만, 이 글의 분위기를 해칠까봐 그냥 넘기기로 한다.
일단, 바둑의 모든 수는 클라우드에 다 저장 되어 있다.
이것은 말이 안된다.
그래서 이게 되기 위해서 현재 나온 기보들의 내욜을 클라우드에 기록해뒀다. 라고 해보자.
그러면, 이세돌 9단의 1국때와 2국때의 놀라운 한수는 그전 기보에 대부분 있어야 된다.
하지만, 없다.
없기 때문에 모든 기사에서 놀라지 않았던가?
그러면, 모든 바둑의 수를 만들어서 클라우드에 다 저장되어 있다. 라고 해보자.
바둑은 그냥 수만 본다면, 361!가지가 필요하다.
대충 계산기를 두들기면, 1.43*10^768개이다.
이것은 거진 뚫리지 않는다는 RSA 2048bit(총 x^2048 = 3.23*10^616)보다 많은 경우의 수 다.
RSA 2048bit 암호를 뚫는데, 이론적으로 거진 10만년 가량 걸린다고 떠들었다.
그런데, 판후이 2단을 48개의 CPU로 이긴 알파고가 모든 바둑의 수를 클라우드에 저장했다?
구글이 딥 마인을 인수한지 2년만에?
이 무슨 개 껌 논리인가?
저게 맞게 돌아간다면, FBI는 애플에게 정보보안지원 요청따윈 필요 없다. 왜냐? 그냥 미친 듯한 클라우드 네트워크와 미친 듯한 컴퓨터 댓수로 밀어 버리면 장떙이다.(이것은 모든 암호에서 100% 뚫릴 것이다. 라고 말했다. 문제는 그만큼 들인 시간이 가치가 있겠느냐? 로 모든 암호는 시간 늘리기 싸움이다.)
그게 안되기 때문에 요청을 하는 것이다. 그리고 미친 듯이 충돌 테스트와 약점 테스트로 우회로를 만들려고 한 것이다.
그런데, 바둑은? 바둑에 우회로가 있긴 한가? 우회로를 컴퓨터에게 어떻게 입력 시킬 것인가? 바둑의 모든 경우의 수에 1%도 못 미치는 바둑 기보를 보고?
우회로가 있긴 한가. 이건 바둑 기사들 모두에게 물어봐도 정석 말곤 없다. 라고 할 것이다. 뭐라고 말할 수 없는 무언가. 그게 있기 떄문에 바둑을 두는게 재밋는 것이다.(그리고 수를 예견해보는 것이 개관의 즐거움이다.)
그런데, 꼴랑 4자리의 비밀번호가 있다면, 0000-9999을 전부 다 입력한 결과로 비밀번호를 찾는 무작위 대입법으로 바둑의 모든 수를 가지고 있다?
웃기지 마라. 비밀번호 최소 8자리 이상, 특수 기호, 숫자, 영어 대/소문자를 섞어서 만들어라는게 괜히 있다고 보느냐?
숫자만 적어도 1자리수는 10가지를 가지지만, 2자리수는 100가지 8자리수는 10^8가지의 경우의 수가 생긴다.
경우의 수를 무시하지마라.
그리고 만약, 바둑의 좋은 수들을 전부다 클라우드에 저장하고 있다고 하자.
그러면, 거기에서 진짜 좋은 수를 어떻게 찾을 것인가?
그게 되었다면, 이미 몇년 전부터 진짜 좋은 수를 찾아 내는 컴퓨터가 나왔을 것이다.
하지만, 그게 되지 않았다.
왜냐? 컴퓨터는 데이터가 있어도 그걸 진짜 좋은 수인지 모르니깐,
예을 들어보자.
1+1+1+1+1+1
1+1+1+1+2
1+1+1+2
1(2*3)
3+3
3*2
자, 결과물은 전부다 동일하다.
어느게 더 효율적인가?
컴퓨터에게 어떻게 하면, 효율적이고, 동일한 결과를 알려줄 수는 있을 것이다.
하지만, 입력에 따라서 바뀌어 져야된다면?(바둑처럼)
프로그래머가 그걸 전부 다 예상하면서 프로그램을 작성 할 수 있을까?
정답은 No!
절대까진 아니지만, 판이 커지면 커질 수록 프로그래머가 입력 할 수 있는 한계점이 분명히 존재한다.
그렇다면, 그걸 타파해야된다.
데이터들을 엄청 많이 가지고 있어도 그 데이터들을 활용하고 처리할 줄 아는 것. 그것이 인공지능인 것이다.
물론, 내가 말하는 인공지능은 약한 인공지능에 속한다.
강한 인공지능은 내가 생각할 수 없을 정도로 엄청난 것이니 넘어가자.
하지만, 데이터가 클라우드에 들어가 있고, 그걸 비교하기 때문에 인공지능이 아니다. 라는 것은 막말 중에 올해의 엄청난 막말이다.
인공지능은 데이터 마이닝에서 없어선 안되는 필수적인 기술이다.
그래서 빅 데이터 다음으로 열광하게 된 것이다. 인공지능인것이다.
인공지능의 종류는 참고된 위키에 보거나 뉴스에 찾아보면 알 수 있듯이.
OCR, 번역기, 음성 인식, 글자 인식 등등 입력 받은 데이터를 가지고 있는 데이터와 비교하여 자동으로 처리하는 것이다.
그런데, 구글이 만든 것이 말도 안되는 무작위 대입 방법을 통해 만든 방대한 데이터를 기반으로 어떻게 처리해야 될지도 모르는 데이터와 입력 데이터를 어떻게든 비교해서 두는 비교 프로그램이기 때문에 인공지능이 아니다. 라는 주장이 맞다고 생각하는가?
도대체 어디서 웃기지도 않는 말로 이야기하는지 모르겠다.
이미 딥 러닝을 배우거나 인공 신경망을 조금이라도 읽어 본 사람들은 알 수 있다.
데이터를 기반을 하여, 컴퓨터에게 학습(배움)을 할 수 있게 만드는 것.
그것이 딥 러닝(심층 신경망)인 것이다.
그리고 그것이 기계학습의 목표이다.
심층 신경망이 나온지도 오래 되었는데, 그딴 웃긴 소리를 하는지 모르겠다.
구글은 사과할 필요가 없다.
구글이 사기가 아닐 가능성이 더 높다.
구글은 그냥 그대로 가줘야 되긴 하지만, 한 가지 구글에게 부탁하고 싶은게 있다.
만약, 진짜 만약에 알파고가 가지고 있는 자가학습 대전 기보들이 데이터 베이스에 들어가 있다면, 바둑계에 공개 해줬으면 한다!
그리고 어떤 판사가 말한 이세돌 9단의 경기의 상금에 비해서 조금 작다. 라는 평이 있는데, 그건 구글 역량으로 맡기는게 나을 것 같다.
대전이 아직 남아 있는 지금.
심층 신경망에는 분명한 단점이 가지고 있다. 엄청난 연산량이 필요하다.(그래서 CPU가 12000개에 GPU가 178개가 붙여서 근근히 속도를 올리는 것이다.)
그리고 과적응 현상.에 취약하다.
인간으로 치면, 고정 관념. 이라는게 생길 수 있다는 것.
왜, 그 값이 나오는지 모른다는 것.
아주 슬픈 이야기다. 알파고가 1, 2국을 복기라는 걸 도와 줄 수 있다. 해도 알파고는 이세돌 9단에게 제대로된 복기를 해줄 수 없다는 뜻이 된다. 그냥 알파고는 이렇게 답할 뿐이다. "해보니깐 이게 좋았다."
이세돌 9단이 지고 있고, 커젠가 커센가 하는 녀석이 엄청나게 모욕을 주고 있는 있다는 점에서 이번 대국이 정말 안타깝다고 생각은 한다. (중국에서 실제로 그런말을 안하고 기자들이 소설을 적었다고 한다. 역시, 기자들의 반이상은 버려져야된다고 생각한다.[2016-03-13])
하지만, 기자라는 사람들/변호사라는 사람의 행동은 정말 욕이 나온다.
옹호하는 사람들이 있을 것 같아서 더 적자면, 이세돌을 위해서 그렇게 한 것이다. 라고 할 수 있을 것 같다.
그럼, 이세돌 9단이 정확하게 조금이라도 의문의 말을 할때 그런 이야기를 해라.
당사자는 이길려고 노력하는데, 지금와서 이딴 이야기를 한다는 걸 봐바라.
이건, 이세돌 9단을 2번 죽이는 일이다.
당사자가 아무 말도 안하는데 그딴 이야기. 절대로 하지마라.
특히, 언론에 위치하는 기자들은 정말 반성해라.
그리고 IT 전문이라고 말하는 변호사는 반성했으면한다.