게시판 즐겨찾기
편집
드래그 앤 드롭으로
즐겨찾기 아이콘 위치 수정이 가능합니다.
게임이론으로 본 스타2의 밸런스
게시물ID : starcraft2_4387짧은주소 복사하기
작성자 : 등물의피
추천 : 12
조회수 : 1267회
댓글수 : 11개
등록시간 : 2010/09/23 17:46:08
1. 빌드 오더 - Strategy

스타크래프트 2를 일컫는 장르 명칭은 RTS 시뮬레이션 게임, 즉 실시간 전략(RealTime Strategy) Simulation Game이다. 단순히 싸움(Battle)이 아니고 전략(Strategy)이라는 말이 사용되는 이유는 더 폼나 보이기 때문이 아니라 실제로 스타크래프트 2가 코만도스류의 게임처럼 규정된 전장에서 규정된 병력을 가지고 싸우는 것을 넘어서, 어떤 병력을 어떻게 생산할 것인가와과 전투 시기, 공격 전략 등등을 포괄적으로 선택하고 수행해야 하기 때문이다. 물론 적과의 전투에 있어선 각 병력을 제어하고 가장 효율적인 방법으로 움직이는 미시적인 컨트롤도 중요하다. 이는 삼국지로 따지면 제갈량+관우의 역할을 동시에 해내야 한다는 것인데, 사실 대부분의 사람은 한가지도 제대로 하기 힘들다. 때문에 스타 1의 초기에는 스타 1에서 전략적인 요소를 제거한 유즈맵(저글링 브루드)시리즈가 유행하기도 했었다. 

우리는 반대로, 전술적인 요소는 제거하고 전략적인 요소만 살펴보기로 해 보자. 은하영웅전설의 양 웬리 장군이 설파한 전술학 제 1원칙은 '항상 적보다 우세한 병력을 가지고 싸움에 임할 것'이다. 때문에 내가 승리하기 위해선 상대보다 더 많은 병력을 가지고 싸워야 하겠는데, 상대 역시 나와 완전히 동일한 초기 조건을 가지고 전략/전술적으로 동일하도록 고려된 지형(대칭인 맵)에 위치해 있다. 어떻게 해야 상대보다 우세한 병력을 가질 수 있나?


이에 대한 한가지 해답은 빌드 오더(build order)를 최적화(optimize)하는 것이다. 모든 건물/유닛에는 생산시간이 존재하고, 또 자원이 투입되며, 이를 채집하기 위한 일꾼 유닛의 생산에도 마찬가지로 생산시간과 자원이 필요하다. 그렇다고 일꾼만 생산하면 자원은 넘치는데 생산건물이 없거나 부족해서 전투병력이 나오는 것이 늦으며, 반대로 일꾼을 적게 생산하고 유닛 생산 건물만 올리다 보면 건물은 많은데 자원이 없어서 생산을 하지 못하는 경우가 왕왕 생긴다. 이러한 조건 하에서는 일반적으로 목표에 따라 단 한가지의 최적화 경로(Optimazed path)가 결정되게 되어 있다. 예를 들어 11기의 광전사를 가장 빠르게, 그리고 자원 낭비 없이 효율적으로 생산하는 방법은 인구수 9일때 수정탑을 짓고, 12일때 관문을 소환하며, 17일때 인공 제어소를 짓는다.... 이런 식으로 하면 가장 빠르게 11기의 광전사를 생산할 수 있다.... 이런 경로가 존재하게 되는 것이다. 이 균형 경로에서 벗어나게 된다면, 광전사를 생산하는데 자원이 모자라거나, 아니면 남아돈다거나 하는 경우가 발생하고, 어느 경우나 11기의 광전사가 갖추어 지는 시간은 최적화 경로를 통했을 때보다 한참 늦어지게 되어 있다. 

그러나 맵이나 인간의 반응에 따라 자원 수급 상황은  미묘하게 차이가 나게 되어 있고, 이러한 오차는 후반으로 갈 수록 누적되기 때문에 이러한 빌드 오더는 초반에는 힘을 발휘하지만 그 이후로는 경험과 플레이어의 감각에 의해서 자원 수급 상황을 판단하고 생산량과 기지 확장 시점을 결정하는 수밖에 없다.

예를 든 11기의 광전사가 아니라 단 한기라도 암흑 기사를 빨리 만들어 디텍터가 없을 거 같은 적 본진을 유린하는 것이 목표라면, 이 때의 최적 경로는 말할 것도 없이 광전사의 경우와 다르게 된다. 즉, 목표에 따라 빌드 오더, Optimazed path는 다 달라지는 것이다. 아마 가스를 더 빨리 짓거나 하겠지. 5광전사로 공격할 것인가, 10기의 광전사에 3기의 파수기를 섞을 것인가 등등에 따라 


그런데 문제는 게임은 혼자하는 것이 아니라는 것이다. 내가 별 무리 없이 최단 시간 11광전사 생산기록 갱신!!을 했다고 이기는 것이 아니다. 이것은 수단일 뿐이다. 최종 목적은 게임에 이기는 것이다. 11광전사를 빨리 만들어 상대 진영에 달렸더니 상대 진영에는 공허 포격기가 두기나 떠있더라.... 또는 암흑기사를 만들어 달렸는데 상대는 벌써 관측선을 운용하고 있더라... 또는 포톤이 촘촘히 박혀 있더라.... 한다면 아무리 내가 컴 상대로 열심히 연습해서 최적화된 빌드 오더를 손에 익혔다고 해도 망할 뿐이다. 즉 빌드 오더라는 것은 플레이어가 선택할 수 있는 하나의 전략이다. 


2. 빌드 VS 빌드 - 게임 이론


프로토스 유저라면 사신에게 한번쯤 된통 당해 본적이 있을 것이라 생각한다. 나만 그렇다고 생각하지가 않는게, 프로토스 유닛의 기본은 광전사인데, 일반적인 빌드 오더상 광전사가 3~5기 나올 쯤에 사신 3기가 본진을 방문하게 된다. 질럿이 5기나 되는데 사신 3을 못막는가.... 라고 생각하지만 그건 오산, 쥐뿔도 화려하지 않은 사신의 무빙샷에 한대 건드리지도 못하고 녹는 질럿의 모양들을 보게 될 것이다. 결국 달랑 사신 3에 연결체 다 터지고 GG. 이것은 11질럿 러쉬 전략 VS 사신 테러 전략 의 승부라고 할 수 있는데, 이렇게 결과가 나온다면 11질럿 러쉬 전략보다 사신 테러 전략이 우위에 있다고 할 수 있는 것이다. 반대로, 테란이 오직 해병만을 생산하여 공격을 왔는데 기다리던 질럿이 반갑게 맞아서 썰어준다면(사실은 이 경우에도 질럿이 녹을거 같다) 땡 마린 전략보다 질럿 러쉬 전략이 우위에 있다고 말할 수 있다. 

그 외에도 스타 2에는 가위바위보처럼 아예 규정된 상성 유닛이 존재한다. 설명서 자체에, '시즈 탱크의 포격은 불멸자로 견디세요. 불멸자의 보호막은 데미지를 크게 감소시킬 뿐만아니라, 중장갑 유닛에 추가 대미지를 입힙니다.' 뭐 이런식으로 말이다. 뭐 그 외에도 적이 저글링이나 마린같은 체력 적은 유닛을 잔뜩 뽑아서 온다면 거신을 생산하여 스플래시 데미지를 노린다던가....토르나 울트라로 온다면 공허로 상대한다던가...... 그렇다면 이 조건에서 양 웬리의 전술한 전술학 제 1원칙을 만족시키는 법이 보이지 않는가? '상대의 전략을 살피고, 그보다 우위에 있는 전략을 선택하여 실행할 것.' 이다. 

문제는, 초보딱지 뗀 상대라면 나뿐만이 아니라 다 모두 다 이렇게 할 거라는 점이다. 고수일 수록 정찰 타이밍, 건물 짓는 위치, 일꾼 숫자 등의 적은 단서로도 상대의 전략을 쉽게 예측해낸다. 

더욱 더 큰 문제는, 이게 턴제 게임이 아닌 리얼타임 전략 시뮬레이션 이라는 특징 때문에, 정찰로 상대의 전략을 확정지을 수 있을타이밍이라면 그 전략은 이미 절반 이상 구현이 되어 있다는 점이다. 암흑 신전 보고 나서야 부랴 부랴 로보틱스 올려도 그 때면 이미 늦었다는 거지. 

상대의 전략을 예측하고, 그에 따라 대응하는건 정말로 게임에 대해서 빠삭하게 파악하고 유연한 플레이어가 아니면 힘든 일이다. 주로 스트레스 풀려고 게임하지 머리 쓰려고 게임하는 게 아닌 일반 플레이어들은 당연히 이런 생각을 하게 된다. '아, 씨 질럿이 오든 추적자가 오든 맹덕이 오든 뮤탈이 오든 뭐든지 강한 그런 빌드 없나? 어떻게 더 효율적으로 빌드를 짜면 그런게 있을 것도 같은데."

만약에, 어떤 전략 A가, 상대가 자신이 선택가능한 전략 a,b,c,d..중 뭘 선택하든지 항상 제일 승률이 높다면, 즉 상대가 질럿으로 오던지 추적자로 오던지 거신으로 오던지 공허로 오던지 항상 대응이 가능하고 그게 또 승률이 가장 놓다면(100% 승리는 못하더라도) 그러한 전략을 게임이론에서는 우월전략이라고 한다. 만약에 스타에 그러한 전략이 존재한다면, 플레이어는 더 이상 전략을 고민할 필요가 없다. 그것만 쓰면 되니까. 그렇다면 스타에는 이러한 우월전략이 존재하는가? 라고 질문할 수가 있는데, 이는 쉽게 판정하기가 힘들다. 질럿 한기, 1초의 타이밍 등 수많은 변수 하나에 승패가 갈리게 되니까, 하지만 현재의 배틀넷 서칭 시스템은 비슷한 실력과 경험의 플레이어 끼리 대전을 시키도록 하여 빌드의 효과를 더욱 뚜렷하게 확인할 수 있으며, 이러한 수 많은 대전에서의 결과로 예측되는 우월전략에 가장 가까운 전략은 역시 테란의 '해병+불곰+탱크+의료선' 조합이다.

통상적인 전략은 모두 고유한 약점을 가지고 있다. 저그는 잘 모르기 때문에 플토의 예를 들자면, 초반 광전사 를 모은다고 치면 이는 불곰에도 무력할 뿐만 아니라 비대칭 전력인 항공전력에 대응할 길이 없다. 즉 초반엔 피크를 찍을 지 몰라도 갈수록 약점이 도드라지게 된다. 추적자의 경우 대공 공격이되며 점멸을 연구할 경우 좀 더 괜찮아 지지만 드라군의 후예 답게 덩치에 비해 화력이 약하고 중장갑이다.....모이면 모일수록 화력을 집중하기 힘들어지며 좁은 곳에 다닥다닥 붙어 있을 수록 탱크 킬 수만 늘려주게 된다. 

후반 유닛의 약점은 말 안해도 될 거 같다. 테크를 올리느라 소모하는 자원 때문에 고스란히 초반이 약해진다. 

이에 반해 해병+불곰+탱크+의료선 조합은 초반이나 중반이나 상관없이 강하다. 오로지 해병으로 와도 강하고, 해병에 불곰을 믹스하면 더욱 강해지며, 의료선까지 생산된다면, 따로 이를 대비하기 위한 전략이 아니면 승률이 0에 가깝다. 그리고 스타 1 때부터 테란은 '입구 건물로 막기'라는 전통적인 전략이 있었다. 즉, 언제나 자신이 유리하다고 판단될 때 지상군 전투를 시작할 수 있었다. 그나마 1 때는 입구를 틀어막으면 나중에 나올 때 자기 건물들을 부수며 나와야 했지만...2 와서는 벙커는 회수가 가능하고 서플라이는 아래로 내려간다..... 맵은 이제 입구와 입구 아닌 곳이 확실히 구분되어 있다....준비가 되었다 생각하면, 아니면 적이 약해 보인다 싶으면 나와서 싸우면 된다. 최강의 방패에 창도 굉장히 쎈 걸 든 셈이다. 

게임 이론에서 만약에 우월 전략이 존재한다면, 합리적인(이기고 싶은) 플레이어는 거의 100%의 확률로 그 전략을 사용한다고 본다. 게임 밸런스 적인 측면에서 이러한 우월전략의 존재는 한마디로 말해서 '있으면 안된다.'

왜 그런고 하면 테란은 방금 말한 것처럼 입구틀어막고 해불탱 노래 부르는게 우월 전략이고, 플토도 비슷하게 테란 상대로 게이트랑 포톤으로 입구 틀어막고 공허포격기 잔뜩 만드는게 우월 전략이라면, 프로토스-테란 전은 무조건 공허 VS 해불탱의 대결이 되기 때문이다. 이렇게 되는 순간 스타2는 전략 시뮬레이션이 아니라 항상 공허와 해불탱이 대결하는 전술 시뮬레이션이 되어버린다. 이렇게 둘다 우월전략을 추구한 나머지 맨날 똑같은, 혹은 거의 비슷한 전장 상황이 나오는 것을 게임이론에서는 '우월 전략 균형'이라고 부른다. 공허 뽑기 재미없으면 추적도 뽑고 거신도 뽑고 할 수 있지만, 그 대신 승률을 대가로 바쳐야 한다. 공허가 있어야 그나마 상대가 되는데 딴 짓하면 더 약해지거든. 아니면 빌드가 완성되기도 전에 찔려서 엘리당하던가. 맨날 똑같은 전투 상황이 벌어지고 그 상황 하에서 누가누가 미세 컨트롤 잘하는 가로, 즉 전술 영역에서만 승부가 나게 되면 스타 2가 인기 있을까?


때문에 플레이어는 항상 우월 전략을 찾으려 하지만, 게임 밸런스 입장에서는 이것은 바람직한 일이 될 수 없다. 본래 게임에서의 패치는 주 목적이 진행상 버그 수정이었지만, 근 10년간 계속된 스타 1의 게임 패치는 이러한 게임 밸런스를 파괴하는 전략/이를 가능하게 하는 너무 강한 유닛을 너프(약화)시키거나 반대로 사용되지 않는 유닛을 강화시켜 3종족 간의 밸런스를 맞추는 데에 있었다. 

3. 테란의 전략적 유연성 - 게임 트리


스타 1이 처음 게임방에 보급되기 시작하고, 아무도 스타크래프트라는 게임에 대해서 아는 것이 없었던 그 때는 '15분 노 러쉬룰'이라는 것이 있었다. 초반 15분 동안 서로 공격하지 않기로 하고, 그 동안 병력 실컷 되는대로 뽑아서 15분 지나면 한판 쌈박하게 붙고 거기서 이기는 사람이 기지도 싹 다 밀어주고 이기는 승부, 캐리어 3부대와 스카웃 5부대가 맞붙는, 위엄이 넘치던 시기였는데, 저기서 스카웃 5부대 뽑던 것이 나다. 맨날 그러니까 상대가 캐리어로 오면 이기고, 드라군/마린/히드라 뽑아서 오면 지고 그랬었다. 

이것은 순차적 게임의 '게임 나무'라는 형식으로 표현할 수 있는데 그걸 그림으로 그려 보면 이렇게 된다. 중간에 --------는 내가 A의 상태에 있는지 B의 상태에 있는지 나는 모른다는 표시이다. 


나중에는 약아져서 상대방이 뭐하는가 보고 스파이어니 이런것들이 있으면 그대로 스카웃을 뽑고 지상군 같으면 캐리어로 전향을 하고 그랬는데, 사실 '15분 노 러쉬룰' 하에선 정찰은 노매너였다. 상대가 뭘 지어놨는지 알면 그에 대해 적절한 대응 유닛을 뽑을 수 있기 때문이었다. 그걸 그림으로 그려 보면 이렇다. 



결국 나같은 인간이 배틀넷에 점점 더 많아지더니, 결국 15분 노 러쉬룰은 사라져 버렸다. 대신 등장한 것이 자원무한맵과 입구틀어막기였다. 무한 맵은 멀티 걱정 같은거 아예 안해도 되게 해주고 건물로 입구틀어막기는 적은 병력으로도 방어를 용이하게 해주었다. 결과적으로는 '노 러쉬룰' 과 비슷한 효과를 내게 되었다. 그러나 점점 더 전술의 발달, 즉 드랍쉽이라던가 리버라던가 이러한 병력 운용으로 방어를 뚫는 전술이 점점 개발되면서 우리가 아는, 피말리게 서로 눈치보고 예측하고 찔러보고 하는 스타크래프트의 모습과 비슷해져 가게 된다. 트리가 점점 더 복잡해진다. 서로 피말리게 탐색을 해 댈수록 가지가 점점 많아지게 된다.



그러나 고수들의 게임일 수록 상황에 맞는 다양한 전략이 사용되고 서로의 전략이 무슨 의미가 있는지 판독하고 그에 따른 대응을 할 수 있지만 초보들의 경우는 어디 그런가, 친구놈들은 '야, 지금 2게이트 올리고 있어.'. '야, 그럼  질럿 찌르기 온다. 대비해.' ㅇ.이렇게 잘도 판별하지만 나는 전혀 그런 것을 알 수가 없더라. 배틀넷에 나같은 초보만 존재한다면 싸움은 스타 1 초기와 마찬가지로 '최대한 자원 잘 써서 많이 뽑고 적절한 타이밍에 러쉬 가서 붙고 그 쌈에서 이기면 이기는 거고 그 때 지면 지는 것"이 초보들의 스타 2 게임 플레이 내용이 되겠는데, 이는 예전에 스타 1에서 입구 막고 러쉬하던 거와 본질적으로 다르지 않다. 상대방의 전략을 판별하고 그에 최적화된 전략을 수행할 능력이 없으니, 그냥 상대가 뭘 하는지는 신경 끄고 자기 생각에 자기가 가장 잘한다 또는 유리하다 싶은 빌드를 수행하는 것이다. 이것은 상대방의 전략을 고려하지 않는다/못한다는 점에서 이론에서 '동시진행(simultaneous) 게임이라는 것으로 해석된다. 

한판 큰 싸움으로 승부가 결정되는 이런식의 플레이는, 우리가 쉽게 보수표(pay-off table)를 만들 수 있다. 예를 들어 나는 질럿 찌르기를 택했는데 상대(테란)는 패스트 멀티를 준비하고 토르를 좀 써볼까 하고 있더라. 이 경우엔 통상 내가 60% 는 이길 수 있더라. 한다면 이 경우의 나의 보수는 0.6, 상대의 보수는 0.4 라고 나타낼 수 있다. 질럿을 준비하고 있었는데 테란이 사신을 보내왔다면 난 '아 망했어요' 가 되겠지. 그래도 어찌 어찌 이기는 경우도 있으니까 이 경우의 보수는 (0.1, 0.9)라고 해두자, 10% 이기고, 90%는 진다는 이야기이다. 이러한 식으로 테란의 주요 전략 5개와 프로토스의 주요 전략 5개에 대한 보수표가 다음과 같다고 가정하고 이야기를 더 전개해 보도록 하자. 




a1~ a5 : 프로토스의 전략 
b1~ b5 : 테란의 전략 

a1: 질럿 + 파수기
a2 : 점멸 드라군
a3 : 패스트 공허
a4 : 패스트 다템
a5 : 거신 + 불멸자

b1 : 땡마린 
b2 : 해불
b3 : 패스트 사신
b4 : 입구 막고 해불탱
b5 : 토르 중심 후반 테크

(플토 승률, 테란 승률)

승률의 합은 언제나 1이므로, 테이블에는 플토의 승률만 표시해도 정보를 잃지 않는다. 


 






이러한 형태의 게임을 2인 영합(고정합) 게임 이라고 일컫는다.





4, 2인 영합 게임의 순수 전략 균형

잠시 스타크래프트 이야기를 떠나서, 제로섬(영합) 게임보수표가 이렇게 생겨먹은 게임이 있다고 하자.


여기서 a 플레이어가 3번째 전략을 a3를 선택하는 경우를 가정하면, 그 전략에 대한 b 플레이어의 최적의 전략은 b3 이다. 그 경우 a 플레이어의 보수는 1이고 b플레이어의 보수는 -1 이 되겠다. 그런데 만약에 b플레이어가 b3 전략을 사용하게 되는 경우를 가정하자. 그 경우에도 a 플레이어는 a3를 선택하는 것이 가장 받을 수 있는 보수가 크다. (할 수 있는 사람은 직접 계산해 보자)

플레이가 계속해서 반복되는 경우, a 플레이어가 한번이라도 a3를 선택하게 된다면 b플레이어는 b3를 선택하게 되며, 그 다음엔 a 플레이어는 b3때문에 a3를 선택할 수 밖에 없다. 결국 (a3,b3)에서 이 게임은 결착이 나게 되는데, 이러한 게임의 균형을 equilibrium pair(번역어를 모르겠다) 라고 부른다. 

equilibrium pair는 게임의 보수가 어떻게 되는 가에 따라 존재할 수도 있고 존재하지 않을 수도 있다. 다음과 같은 예를 보자.

이러한 보수표에서는 equilibrium pair가 존재하지 않는다. 



equilibrium pair가 존재하려면 보수표가 다음의 조건을 만족해야 한다고 증명되어 있다. 

1. 플레이어 b의 Maximin(최대극소) 전략과 플레이어 a의 Minimax(최소극대) 전략의 보수가 일치한다. 
2. 보수행렬에 안장점(Saddle point)가 존재한다. 

1와 2는 곧 알게 되겠지만 필요충분 조건이다. 즉 같은 말.

최대극소 전략과 최소극대 전략에 대해서 설명을 해보자. 저 보수표는 플레이어 a, 프로토스의 관점에서 쓰여진 거다. 그렇다면 열에서 선택하는 테란, 혹은 플레이어 b는 저 중에서 가장 작은 숫자가 실현되는 것이 자신에게 이익인거다. 프로토스 혹은 플레이어 a는 물론 저 중에서 가장 큰 숫자가 실현되는게 자신에게 이익인거고.

그런데 내 상대방은 어떻게든 숫자를 줄이려 들게 뻔하다. 그렇다면 상대방이 그렇게 나올 걸 감안한다면, 그 중에서 내 이익을 극대화 하려면 나는 어떠한 선택을 해야 하는가? 에 대한 답이 MiniMax(최소극대) 전략이다. 처음에 나온 보수표를 보자. 내가 a1 전략을 선택한다면 상대방은 b2를 선택하려 들것이다. 그럼 내 보수는 -1. a2를  선택하면 b3을 선택할 거다.그럼 -2. 이런 식으로 a3를 선택하면 내가 얻게 되는 보수는 1이 된다. 이러한 가정 하에선 나는 a3를 선택하는 것이 가장 낫다. 이 때 a3를 플레이어 a의 최대 극소 전략이라고 하며, 이 경우 그 보수는 1이다. 

이제 a가 플레이어 b의 입장에서 생각해 본다고 하자. 저놈 (실제로는 a)는 내가 어떤 전략을 선택하던지 간에 그 중에서 가장 커다란 숫자를 선택할 것이 뻔하다. 즉 b가 b1를 선택한다면 a3를 택해서 5를 얻으려 할 것이다. b2를 택하면 역시 a3를 택해서 7을 가져갈 거고... 상대의 숫자를 줄여야 하니까 이러한 가정 하에선 나는 b3를 택해서 a한테 1을 주는 수밖에 없다. 

결론적으로 a는 1, b는 -1의 보수를 얻고 균형은 (a3, b3)에서 이루어진다. a가 a3로 나왔는데 b가 b3 말고 b2나 b4를 택하거나 하면 손해고, a역시도 b가 b3로 나왔는데 a1이나 a2를 고르면 손해이므로 이것은 equilibrium pair이다. 

행렬에서의 안장점(Saddle point)이란, 그 줄에서는 가장 크거나 가장 큰 것과 같은데, 그 열에서 보면 가장 작거나 작은 것과 같고, 열에서 보면 가장 크거나 큰것과 같은데  그 줄에서 보면 가장 작거나 작은 것과 같거나 한 원소를 말하며, 첫째 보수행렬에서 (a3, b3)를 따지면 이러한 조건을 만족한다는 것을 알 수 있다.

두번째 행렬은 때문에   (a2, b3)의 보수가 바뀌어 있다. 그래서 Maximin값은 0이 되고 minimax값은 1이 되어 더 이상  equilibrium pair가 존재하지 않게 된다.  (a3, b3)가 안장점도 아니게 되어 버렸다. 

그럼 다시 스타 이야기로 돌아와서, 만약에 스타 2의 보수 행렬에, equilibrium pair가 존재한다면 무슨 일이 벌어질까? (a3, b4)가 equilibrium pair라면 오직 스타 2 테플전은 패공과 해불탱의 대결이 될것이고, (a5, b5)에서  equilibrium pair가 이루어진다면 둘다 후반까지 질질 끌다 토르와 거신만이 대결하게 될 것이다. 맨날 똑같은 대결만이 이루어진다면 게임 재미 없겠지. 때문에 이런 것은 지양되어야 한다. 저 보수표에서는 과연 equilibrium pair가 존재 할까?




플토의 관점에서  minimax값은 0.6 Maximin값은 0.4가 된다. 때문에 equilibrium pair는 존재하지 않고, 따라서 안장점 역시 존재하지 않을 것이다. 적어도 플테전에 있어서 오직 한가지 전략만이 통용되는 것은 아니며, 때문에 플테전은 스타 2에 등장하는 다양한 유닛들이 다채롭게 사용될 수도 있을 것이라 기대 할 수 있다.


하지만 이것 만으로 밸런스에 문제가 없다고 할 수 있는 것일까? 


그게 그렇지가 못하다. 


5. 2인 영합 게임의 혼합 전략 균형


내가 스타2를 시작한지 일주일도 안된 초보중에 초초보라서, 광전사랑 드라군 빌드밖에 쓸 줄 모른다고 치자. 그렇다면 내가 사용할 수 있는 순수 전략은 달랑 2개 밖에 안되는 셈이다. 테란 상대로 질럿 러쉬의 승률이 A, 추적자 러쉬의 승률이 B 라고 치자. 

통상적으로는 A<B 라면 누구나 추적자 러쉬를 생각할 테고 테란도 이에 대한 대비를 하겠다만, 승률 따위는 관심 없고 동전던지거나 주사위 굴려서, 또는 다른 랜덤한 방법으로 질럿으로 갈지 추적자로 갈지를 결정한다고 가정하자.  σ의 확률로 광전사 러쉬를 가고 (1-σ)의 확률로 추적자로 가게 되는건데, 이러한 랜덤한 전략도 전략의 한가지로 인정한다면, 순수 전략은 단 두가지인 경우라도 혼합 전략은 무한대의 가짓수가 나오게 되며, 그 경우의 전체 승률은 σA+(1-σ)B 가 되게 된다. σ는 0부터 1사이의 무엇이든지 가능하기에 전략의 수가 무한대가 된다. 이러한 전략을 혼합 전략이라고 부른다. 순수전략이 2가지일 경우라도 그를 혼합한 전략의 가짓수는 σ를 어떻게 결정하는 가에 따라 무한대로 나온다. 선택 가능한 전략이 3개, 4개 이상일 경우에는 말할 필요도 없다. 아까 예를 든 3*4 게임의 예를 들면, 이런 식으로 선택 가능한 전략이 무한히 확장된다는 것이다.




이렇게 혼합 전략을 인정하게 된다면, 그 게임은 비록 2*2 게임이라도 무한*무한의 게임이 되어버리는 것과 마찬가지이다. 아까 우리가  equilibrium pair를 고려할 때, 3*4 게임은 12가지 경우 5*5게임은 25가지 경우만 고려해 보면 되었다. 아마  M*N게임은 MN가지 경우만 계산해 보면 될 것이다. 그런데 이렇게 무한대 * 무한대인 경우에는 equilibrium pair가 하나쯤 존재하지 않을까? 

이에 대한 증명이 Von neumann Theorem이며 그 내용은 다음과 같다.



혼합 전략을 인정할 경우 모든 표준적인 전략형 게임에서, 반드시 적어도 1개 이상의  equilibrium pair가 존재한다.


무슨 게임이론 강의 하고자 하는게 아니니까 증명과정은 생략한다. 

여하간 있기는 있다고 하는데 무한 개의 전략의 Minimax 값이랑 Maximin 값을 다 계산해 볼 수도 없는 노릇이고, 있다고 해도 이걸 어떻게 구한다지?


이에 대한 해법은 Simplex method(심플렉스 방법)이라고 하며 선형계획법의 일종이다. 요는 주어진 보수표 아래서 플레이어 A는 자신에게 가능한 이전략 저전략을 섞어 자신의 보수를 극대화 시키려 하고 B는 가능한 한 줄이려 한다. 이것도 설명하기 시작하면 한 세월이 걸릴 거 같으므로 그냥 '혼합 전략의  equilibrium pair를 구하는 방법이 존재한다.'정도만 알아두고 넘어가자.


아까 확인한, 명백히 순수전략 equilibrium pair가 존재하지 않는 두번째 3*4 영합 게임의 경우에도 이 방법을 이용하면 혼합 전략 equilibrium pair는 존재함을 알 수 있다. 그 equilibrium pair은



플레이어 a는 (4/5, 0,1/5)확률로 섞는 혼합 전략을 사용하고,b는 (1/5,0,0,4/5)의 혼합전략을 사용하는 데서 이루어지며, 이 때의 보수는 9/5이다. 즉 이 게임의 결과로 플레이어 a는 9/5 의 보수를 얻고 영합 게임이므로 b는  - 9/5를 얻게 된다. 시간 나는 사람은 플레이어 a가  (4/5, 0,1/5)의 혼합 전략으로 나왔을 때 플레이어 b가 그 어떤 혼합 전략을 써도 - 9/5 이상의 보수를 얻는게 가능한지 불가능한지 알아보자. 이론 상으로는 불가능하다.



여하튼, 이러한 분석의 틀을 스타2로 가져 오게 된다면, 내가 임의로 설정한 보수 행렬에 대한 혼합 전략   equilibrium pair는,



테란 = {0.268908, 0.369748, 0.109244, 0.252101,0}
프로토스 = {0.226891, 0.252101, 0.184874, 0., 0.336134}


게임의 value는 0.459664, 즉 위와 같은 균형에서 플토는 46% 정도의 승률을 기대할 수 있다. 54%는 물론 테란꺼.

이 된다. 특이할 점은 혼합 균형에서 사용되지 않는 전략들로써 위 보수표의 경우 테란은 토르 빌드를, 프로토스는 다크템플러 빌드를 사용하지 않게 된다. 프로토스가 다템을 못쓰는 이유는 너무나 명약관화하다. 테란이 어떻게 나와도 10%밖에 못이기니 쓰면 어떤 경우에도 쓰면 안되는 것이 뻔히 보이지 않나. 이런 것을 강열등 전략이라고 하며, 합리적인 플레이어라면 절대로 선택하지 않을 전략이기에 통상적으로는 균형 분석에서 빼도 상관 없는 전략이다. 

테란의 토르 빌드도 마찬가지. (0.7,0.6 0.6,0.1,0.4)로 해병 + 불곰하고 비교하면 (0.5,0.4,0.6,0.1,0.4)로 플토가 다템이나 거신, 공허로 나올 때는 승률이 같지만, 그 이외에는 항상 해불이 승률이 높다. 그러니 합리적인 플레이어라면 토르는 저리 치워두고 모든 상황에 해병과 불곰을 쓰게 되어 있다. 이를 약열등 전략이라고 하며, 역시 왠만해서는 쓰이지 않는 전략이다. 


 
6. 스타2 밸런스의 의미 및 분석 

우리가 통상 게임 밸런스가 맞다고 생각하는 것은 다음 두 조건이 만족하는 것을 가리킨다고 본다. 

1. 비슷한 경험과 포텐셜을 가졌으나 종족만 다른 두 플레이어의 기대 승률이 50%이다.
2. 가능한한 다양한 유닛과 전략이 사용되어야 한다. 


위에 내가 짜 놓은 보수표는 이 조건을 그런대로 만족한다고 본다. 토르와 다템은 봉인되지만, 그래도 다른 4가지 전략이 균형있게 사용되고 있지 않은가. 하지만 블리자드에서 유닛간 밸런싱을 잘못해서 해병+불곰+탱크 조합에 (0.3,0.4,0.3,0.1,0.3)이런 보수표가 나왔다고 치자. 이는 어떤 경우든지 다른 어떤 전략보다도 우월한 승률을 제공하기에, 이기고 싶은(합리적인) 테란 플레이어라면 100% 이런 전략을 선택하게 되어 있고, 당연히  플토는 이게 뻔하니까 항상 추적자만 뽑아서 대응하는 수밖에 없다. 그렇게 되면 항상 드래군 대 해불탱의 싸움이 되고, 테란이 60%의 승률을 챙기게 된다. 이러한 균형에 참여하지 않는 플레이어는 손해를 본다. 이는 올바른 밸런싱이라고 볼 수가 없다. 

이쯤 말하면 눈치챘겠지만, 저러한 구조의 밸런싱은 어렵다. 우선 저러한 보수표 자체가 잘 눈에 보이게 확정되는 것이 아닐 뿐더러, 확정 된다고 해도 종족간 기대 승률이 50%가 되게 조정하면서, 동시에 버려지는 전략과 유닛이 없도록 하는 것은 묘기에 가까운 기예일 것이다. 단순무식한 한 가지 방법은 대칭 게임을 만드는 방법, 워크래프트 2마냥 휴먼과 오크가 유닛 생긴거만 다르고 유닛들 기술이나 성능이 같으면 쉽게 되긴 하는데, 이러면 게임이 재미가 없겠지. 특색이 뚜렷한 종족간 차이야 말로 워3나 스2의 재미인데 말이야. 스1의 경우에는 그렇게 고치고 고치고 고치고 해서 밸런스를 맞추는데 10년이 걸렸다고들 한다. 


저플전, 저테전의 경우는 '전혀' 생각치 않고 오직 플테전만 고려해도 이렇다. 그것까지 생각하게 되면.....과연 스타 플레이어나 스타 방송 시청자들이 추구하는 '완벽한 밸런스'라는 것이 존재할지 의문이다. 



뭐 여하튼 이 분석의 한계점 중 가장 큰 것은 이 분석이 '정찰 같은거 몰라서 질럿 다뽑으면 어택땅'이 한계인 초보자들을 대상으로
했다는 사실인데, 그래서 가정한 것이 전략형 게임 normal form game이었다. 달리 말하면 고수라 하는 플레이어들은 상대의 전략을 살피고 자신의 전략을 결정할 수 있다는 사실인데, 그렇다면 이를 전개형 게임 extend form으로 확장하게 되면 고수들의 플레이 역시 게임 이론의 틀 아래에서 분석할 수 있지 않을까 싶다. 이를 다시 이와 비교하게 되면 속칭 '쩌그'같은 플레이어의 존재가 어떻게 가능한지 대충 이야기해 볼 수 있을 거 같은데 누가 나대신 안해주려나.


우선 이쯤에서 마친다.




참조 : introduing game theory and its applications, Eliiot Mendelson'







저그는 예시에 포함되지도 않았다
꼬릿말 보기
전체 추천리스트 보기
새로운 댓글이 없습니다.
새로운 댓글 확인하기
글쓰기
◀뒤로가기
PC버전
맨위로▲
공지 운영 자료창고 청소년보호