눈으로 보이는 정보로부터 「보이지 않는 부분」을 추측해서 3D모델을 생성하는 「GQN」
사람이 테이블 책상등 큰 널빤지와 다리 3개를 눈으로 확인하면, 「뒤에 4개째 다리가 있다」라고 머리 속에서 멋대로 추측합니다. 이러한 작업은 인간에 있어서는 용이한 것입니다만, 인공지능에 있어서는 대단히 곤란한 작업이다고 여겨지고 있습니다. 구글 모회사 Alphabet산하 AI기업 DeepMind는 시인할 수 있는 정보로부터 눈으로 보이지 않는 부분을 추측하는 「Generative Query Network(GQN)」를 개발했습니다.
https://deepmind.com/blog/neural-scene-representation/
GQN은 입력된 이미지로부터 물체 형상과 위치 관계를 예상하고, 3D공간을 생성하는 것입니다. GQN 구조에 대해서는, DeepMind가 무비로 해설합니다.
Generative Query Networks
또, GQN으로 생성한 3D공간은 지정한 시점이외에도, 좋아하는 시점에서 볼 수 있습니다. 예를 들면,「observations(관측)」에 있는 이미지가 입력되면, GQN은 「neural rendering(뉴럴 표현)」에 예측한 3D공간을 생성하면……
FPS 게임을 플레이하고 있는 것 같이 시점 위치를 연속적으로 바꾸는 것을 가능합니다.
DeepMind에 의하면, 현시점의 GQN에서는 해상도가 낮은 모델만이 작성가능하다고 합니다. 그러나, 앞으로의 하드웨어 진보 등에 의해, GQN으로 보다고해상도 모델에도 대응가능해진다고 해, VR이나 AR 응용도 시야에 감안하고 있습니다.
'구글' 카테고리의 다른 글
구글이 유니티와 제휴해 온라인 게임 제작용 툴을 개발중 (0) | 2018.06.21 |
---|---|
구글 번역을 사용한 직무질문이 위법이다고 해서 코카인 소지 현행범이 석방된다 (0) | 2018.06.18 |
「구글이 퍼블릭 도메인 기술을 특허취득으로 침해하려고 한다」라고 개발자 본인이 주장 (0) | 2018.06.12 |
어린이대상 안드로이드 앱 50%이상은 뒤에서 사용자 정보를 수집한다 (0) | 2018.06.10 |
「샐러드 그림문자에서 계란을 삭제」구글, 채식주의자에개 배려해서 논쟁ㅋㅋㅋ (0) | 2018.06.10 |