전 사실 바알못인데, 알파고에 관심이 많아서 알파고를 분석 중 입니다.
그래서 "신의 한수"인 이세돌 9단의 78수를 유심히 보고 있는 데요, 그러다 보니 "알파고"의 로직 인 몬테카를로 트리서치(MCTS), 그리고 데니스 하사비스의 트위터의 발언 등을 보았을 때 한가지 가설을 생각해 보았습니다.
데니스 하사비스는 이런 두가지 트위터를 날렸죠.
"알파고가 79수에 실수를 했고 87수에서야 알아차렸다."
"이세돌이 그 곳에 돌을 둘 확률은 1/10000 (00.01%) 였다."
이 두 마디의 트위터, 그리고 알파고의 MCTS 가능성이 없는 경우에 대한 "가지치기"(Pruning)에 대한 알고리즘을 생각하였을 때 알파고가 이런 판단을 할 수 있지 않았을 까 하는 가설을 해보았습니다.
=====================================================================================================================================
1. 77수
알파고는 중앙 상단 부분 흑의 자신의 큰 세력을 형성하고 있다.
여기서 알파고의 가치망은 돌이 놓일 위치를 계산 한다. 이 때 이세돌 9단이 돌을 놓은 78수의 자리는 "보지 않는 다." 돌이 놓일 확률이 0.01%(1/10000) 밖에 되지 않기 때문이다.
2. 78수 (신의 한수)
이세돌 9단의 "신의 한수"가 놓인 다. 하지만 알파고는 이를 인지하지 못 한다.
그 곳은 "착수"할 리 없는 위치기 때문에 MCTS는 그 곳을 "검색"하지 않는 다.
3. 86수 (87수에 착수 하기 전)
87수를 착수 하기 전 수인 86수, MCTS는 그 지점을 "착수"를 할 수도 있을 정도의 확률 정도로 인식을 하고 검색을 시도한다. 하지만?
이미 그 자리에 백의 돌이 있다?
이제 와서 알파고는 이 가운데 형세가 "깨졌다는 것" 알아 챈다. 그리고는 던질 수 가 떡수 밖에 없다고 판단한다.
======================================================================================================================================
여기 까지가 알파고의 눈으로 본 떡수의 이유라고 추측해 봅니다.
그리고 이 건 제가 바알못이라 바잘알 분들 한테 여쭤보고 싶습니다.
알파고는 이미 중앙 상단 전투를 승리라 판단하고 우측으로 전장으로 옮긴 것으로 생각 됩니다.
그리고 이세돌 9단이 놓은 저 착점 자리에 돌을 놓으려 했을 거라 생각해 봤는데요.
이 그림이 되면 어떤 가요?
그럼 혹시 알파고의 "떡수"들에 대한 이해가 가능한 상황인가요?
일단 아무튼 저는 저 상황은 MCTS의 "가지치기" 알고리즘 특성 상 "매우 낮은 확률 착수" 지점에 돌이 놓이면 알파고가 그 것을 찾는 데 오랜 시간이 걸릴 수 있다는 생각이 드네요.
바잘알 분들의 조언 부탁드립니다 (__