엘론 머스크

누구나 심층강화 학습 스킬을 활용할 수 있기 위한 교육 자원 "Spinning Up", OpenAI가 발표

나나시노 2018. 11. 9. 17:37
반응형




누구나 심층강화 학습 스킬을 활용할 수 있기 위한 교육 자원 "Spinning Up", OpenAI가 발표




AI기술을 이해하기 위해서는 기계학습 지식을 익힐 필요가 있어, 특히 심층강화 학습을 이해해서 활용할 수 있게 되는 것이 불가결합니다. "엘론 머스크"씨들이 설립한 인공지능을 연구하는 비영리 단체인 OpenAI는 심층강화 학습을 배워서 누구라도 practitioner(활용자)가 되도록 하기 위한 교육 자원 「Spinning Up」을 공개했습니다.


테슬라·SpaceX 등을 인솔하는 엘론 머스크씨나 와이콤비네이터 Sam Altman씨들이 설립한 OpenAI는, AI가 인류에게 해를 끼칠 일 없고, 유익하게 이용하는 것을 목적으로 해서 내걸었습니다. 그런 OpenAI가 발표한 Spinning Up에는 알기 쉬운 샘플코드나 연습문제, 참고 문헌, 튜토리얼 등이 포함되어 있습니다.


기계학습은 반드시 학습 허들이 낮지 않습니다. 그러나, OpenAI 스칼라십 프로그램이나 펠로우 프로그램 실적으로, OpenAI는 적절한 도로 표식이나 교육용 자원도 갖춰져 있으면 완전한 초보자라도 짧은 시간이라도 심층강화 학습을 사용할 수 있게 된다고 확신하고 있습니다. Spinning Up은 이 사고방식을 바탕으로 만들어진 자원이며, 2019년1월부터 시작될 2019 Winter Scholars Application Open 커리큘럼에도 통합되어 있습니다.


https://spinningup.openai.com/en/latest/


코어 컴포넌트 5개로 만들어진 것


1.강화 학습 전문 용어, 알고리즘 종류, 기본이론에 관한 인트로덕션

2.학습을 통해서 강화 학습 연구 분야에서 역할을 짊어지게 되는 것에 관한 에세이

3.토픽마다 모아진 중요한 논문 리스트

4.이하 학습 강화 방법을 구현하기 위한 소스코드 리포지토리: 「Vanilla Policy Gradient (VPG)」 「Trust Region Policy Optimization (TRPO)」 「Proximal Policy Optimization (PPO)」 「Deep Deterministic Policy Gradient (DDPG)」 「Twin Delayed DDPG (TD3)」 「Soft Actor-Critic (SAC)」

5. 가벼운 워밍업용 연습 문제


반응형