구글

바둑AI「AlphaGo(알파고)」나「DQN」개발원 DeepMind가「스타크래프트2」로 최강인 AI구축에 도전중

나나시노 2017. 8. 10. 13:15
반응형




바둑AI「AlphaGo(알파고)」나「DQN」개발원 DeepMind가「스타크래프트2」로 최강인 AI구축에 도전중





인공지능(AI)은 언제 어느 분야에서 인간을 쫓아 빼 가는 것인가? 라고 하는 연구 안에서는「스타크래프트는 2018년경에서 2033년에 걸쳐서 AI에 앞질러진다」라고 하는 예측이 나왔습니다만, 실제로 「스타크래프트2」를 인간보다도 능숙하게 플레이 할 수 있는 AI를 개발하기 위해, DeepMind와 Blizzard가 움직이기 시작했습니다.



Google 모회사인 Alphabet산하의 AI연구 기업이 DeepMind입니다. DeepMind라고 하면, 중국 최강기사에게 이긴 바둑AI「AlphaGo」나 게임을 스스로 배워서 인간이상의 플레이를 하는 AI「DQN」등을 개발한 기업입니다.


그런 DeepMind는 게임 개발 기업 블리자드가 2016년에 개최한 「Blizzcon 2016」에서, SF 전략 게임 「스타크래프트2」와 협업해서 개방적인 AI연구 환경을 구축한다고 하는 계획을 발표했습니다.



이 계획이 실제로 시작하고 있어, DeepMind와 Blizzard는 기계학습API나 대규모 게임플레이 데이터 세트, 오픈 소스의 DeepMind툴 세트를 포함하는 최신 툴을 제공했습니다.


이하 무비는 AI연구를 위해서 제공된 툴에 하나 「PySC2」 동작을 무비로 한 것입니다. PySC2는 AI가 게임을 플레이하기 위한 유연해서 쓰기 쉬운 인터페이스를 제공하는 툴로, 게임의 기본적인 시각적 및 공간적 요소를 유지하면서, 유닛 타입, 상태, 지도의 시인성등, 요소를 서로 분리한 「피처레이어」에 표시했습니다.


DeepMind open source PySC2 toolset for Starcraft II



게다가, Blizzard는 최신 스타크래프트2 API로, 클라우드상에서 실행할 수 있게 만들어진 Linux·Windows·Mac에 적합한 패키지를 제공했습니다. 또, 오프라인으로 AI 대 AI 배틀을 실시할 수 있게 되거나, 인간 플레이어로 익명으로 게임 리플레이를 제공하게 하거나, AI가 자기학습하기 위한 데이터를 착실하게 늘리고 있다고 합니다.


스타크래프트2는 기본적으로 AI연구에 있어서 대단히 유용한 환경이다고 해서, 이것은 게임 복잡 마을 다양성, 그리고 각각 시합에 있어서 승리하는 길이 복수존재한다고 한 부분이 영향을 줍니다. 또, 플레이어는 자원 관리나 생성, 군대 지휘, 방어 시설을 건설 등, 다양한 요소를 동시에 진척시켜 갈 필요가 있어, 더해서, 게임에 관한 모든 정보가 곧 이용할 수 있는 것이 아니라, 플레이어는 전제와 예측에 근거한 행동을 취할 필요가 있기 때문에, 지금까지 DeepMind의 AI가 도전한 것보다도 훨씬 복잡한 태스크를 요구됩니다.


단, 모두를 동시에 처리하는 AI를 개발하는 것은 너무나 곤란한 것이기 때문에, 태스크를 분해해서 연구고 있는 상황입니다. 자원을 회수하거나 설비를 구축하거나고, 게임내에서 액션을 세분화해서 각각을 실행가능하게 해, 최종적으로는 인간 플레이에게 이길 수 있는 AI를 작성하려고 합니다.



반응형