IT,과학

인공지능(AI)이 스탠포드 대학교 독서 실험에서 인간을 능가하는 스코어를 마크

나나시노 2018. 1. 16. 13:36
반응형




인공지능(AI)이 스탠포드 대학교 독서 실험에서 인간을 능가하는 스코어를 마크





2018년1월, 알리바바는 독자개발한 딥뉴럴네트워크 모델 성능을 실험하기 위해서, 인공지능(AI)에 10만개이상의 질문을 주고, 정확한 회답을 이끌어 내놓을 수 있는 것인가 아닌가 실험을 했습니다. 이 「AI에 주어진 질문」이라고 하는 것은, 스탠포드 대학교가 만든 독해 실험데이터셋 「SQuAD」, 이 실험으로 Alibaba가 개발한 AI는 인간보다도 우수한 스코어를 두드리기 시작했습니다.




500을 넘는 Wikipedia내 기사를 기초로 만들어져 있는 SQuAD의 질문은, 기계학습 모델이 대량인 정보를 처리하고, 질문에 정확한 회답을 제공할 수 있는 것인가 아닌가를 밝히기 위해서 만들어진 것입니다. 이 SQuAD를 이용해서 AI 독해 성능을 테스트하는 것으로, AI가 어느 정도 독해 성능을 가지고 있는 것일지를 스코어로 평가할 수 있습니다. 이 SQuAD 테스트에는, 구글이나 IBM, Microsoft, 삼성, 텔아비브 대학교, 캔 원 국립 대학교 등, 다양한 연구 기관과 IT기업이 참가했습니다. 그중에서, 알리바바가 개발한 AI 「SLQA+」가 「82.44」라고 하는 스코어를 기록했습니다.




Alibaba에 의하면, SLQA+가 인간의 스코어(82.304)를 상회한 것은 이번이 처음이다고 합니다. 한편, Alibaba가 SLQA+의 스코어를 발표하는 2일전에, Microsoft의 AI 「r-net+」도 인간이상의 스코어가 되는 「82.650」을 기록했습니다.


다른 참가자 스코어는 이하 페이지로 확인할 수 있습니다.



Alibaba가 사용한 뉴럴네트워크 모델은 「단락으로부터 문장, 단어까지」를 읽어내서 회답을 특정하는 「Hierarchical Attention Networks」라고 하는 기술을 기초로 하고 있습니다.


실제로, 이 기술은 거래 총액이 1682억위안 (약28조원)까지 도달한 「독신의 날(Singles' Day)」 문의대응에도 이용했습니다.




알리바바는 같은 중국 텐센트나 바이두와 같이, AI개발 경쟁에 참여하고 있습니다. 중국은 2030년까지 AI산업에 있어서 업계를 견인하는 입장에 오르는 것을 원하고 있어, 그 때문에 AI관련 기업에 많은 지원을 하고 있습니다. 그런 AI를 활용하는 분야에서도, SLQA+와 같은 「인간의 언어를 이해하려고 하는 것」은 자연언어처리라고 하는 분야에 분류됩니다.


알리바바에서 자연언어처리에 관한 연구를 하고 있는 Luo Si씨는 「이 기술(SLQA+)은 고객 서비스, 박물관의 튜토리얼, 환자에게서의 의료문의에 대한 온라인 응답 등, 수많은 용도로 서서히 채용되기 시작하고 있어, 전례가 없는 방법으로 인간에 의한 입력을 줄일 수 있습니다」라고 이야기 했습니다.



반응형