ㅁ주어진 환경
게임화면
ㅁ명령
화면에 보이는 점수를 최대로 하라.
※중요한 점은 컴퓨터(알파고)에겐 이게임을 플레이 하기위한 어떠한 알고리즘도 입력되어 있지않음.
ㅁ결과
10분 후 - 공을 쳐내고 받는 알고리즘을 발견, 하지만 아직 어설픔.
120분 후 - 전문가 수준으로 플레이.
240분 후 - 벽쪽에 터널을파는것이 가장 효과적인 방법이라는것을 깨달음.
대충 1~2년전 초창기같네요.
규칙도 모르면서 단지 점수를 높여라라는 명령에 사고를 정말 한것에 놀랐네요.
거기에 명령을 만족하데 그치지 않고, 최선의 방법을 찾다니...
인공지능이 벌써...ㄷㄷㄷ