AI에 「슈퍼 마리오 64로 스타를 획득하는 방법」을 학습시킨다
기계학습이나 뉴럴네트워크 등을 이용해서 인공지능(AI)에 학습을 시행하고, AI거 혼자서 게임을 클리어 할 수 있도록 한다라고 하는 시험삼아 많은 엔지니어들이 도전하고 있습니다. Google도 게임 전용 「DQN」이라고 하는 AI를 개발하고 있어, 그 외에도 AI에 슈퍼 마리오 월드나 슈퍼 마리오 카트를 플레이시킨다고 하는 시도가 인터넷상에서 공개되어 왔습니다. 그런 AI×게임의 시도로, 마침내 2D게임이 아니고 3D게임인 「슈퍼 마리오 64」를 학습시킨다고 하는 것이 시작했습니다.
최대 24명이 슈퍼 마리오64이 동시 플레이 할 수 있는 「슈퍼 마리오 64 온라인/Super Mario 64 Online」이나, 슈퍼 마리오64을 해킹해서 마리오시점으로 플레이하는 무비 등을 공개한 Kaze Emanuar씨가, 많은 AI에 「미로 속에 있는 스타」나 「여기저기 도망쳐 다니는 노란 토끼」의 장소까지 마리오를 안내시킨다고 하는 도전을 하고 있습니다.
AI가 조작하는 마리오가 스타 목전까지 다가가고 있는 모양은 이하 무비로 볼 수 있습니다. 게임 화면 좌측밑에 씌어져 있는 것이 이용하는 AI인 것 같고, 그 중에 하나는 「mAIrio」라고 하는 GitHub상에서 코드가 공개되고 있는 오픈 소스의 것입니다.
게임 미디어 Kotaku가 Emanuar씨에게 메일로 인터뷰한 결과, 사용한 AI는 「대단히 느린 것」이다라고 설명하고 있어, 이 AI는 특정한 상황에서의 해결 방법을 광범위하게 적용해버리는 경향이 있습니다. 그래서, AI가 한동안 같은 장소에서 점프나 펀치를 되풀이하는 것은 진귀하지 않은 광경이다고 합니다. 그래도 이 AI는 복수회에 걸쳐 스타를 획득하는 것에 성공하고 있어, 「하나의 AI가 약15분으로 스타를 손에 넣는 것에 성공하고 있습니다만, 이것은 기술적인 측면보다도 운이 좋았기 때문에라고 말할 수 있습니다」라고 Emanuar씨는 이야기 했습니다. 또, 다른 사용자가 이용한 AI에서는 약3시간에 하나의 스타를 획득하는 것에 성공했습니다.
슈퍼 마리오64이 복잡한 스테이지를 AI에 모험시키는 것에 대해서, Emanuar씨는 「3D공간전체가 너무나 복잡하므로, AI의 뇌내에 모든 정보를 입력할 수는 없습니다. 이 입력 정보를 간소화하고, 주변의 작은 공간 등이 잘잘한 디테일을 처리능력상에서 잘 동작시킬 필요가 있습니다」라고 이야기했습니다.
Emanuar씨는 지금까지 AI를 채용한 경험이 없었다고 해서, 몇 가지 책을 읽으면서 시행착오하고 있는 단계입니다. 그래도 AI는 몇 가지 흥미 깊은 액션을 배웠다고 해서, 「하나의 AI는 점프해서 고소에 액세스하는 기술을 배우고, 또 하나의 AI는 경사에서 3단 점프하는 것을 배웠습니다. 이 AI가 학습한 액션은 보통 플레이어가 결코 하지 않는 것 같은 액션이며, 슈퍼 마리오64에 숨겨진 테크닉인 것 같습니다」라고 이야기 했습니다.
한편, Emanuar씨의 Twitch채널에는 이하로부터 액세스 가능하고, AI에 슈퍼 마리오64을 플레이시키고 있는 모양을 볼 수 있습니다.