【15-A-5】 将棋プログラムPonanzaにおける強化学習、ディープラーニングとその先

  

本セッションでは、2017年春に名人に勝利した将棋プログラム「Ponanza」における強化学習の使われ方やディープラーニングの導入についてご紹介いたします。
さらに、これまで「大貧民」「カーリング」「囲碁」など多数のゲームAIの研究開発を行なった中で得た知見から、ゲームAIの現在の到達地点と今後の展望についてお話しいたします。

大渡 勝己 [HEROZ]

HEROZ株式会社

東京大学大学院総合文化研究科修了。学生時代よりゲームに勝つためのAI研究に取り組む傍ら、10種類以上のゲームAI大会に参加し研究と実装の両面でゲームAIに携わりました。第35回、第37回情報処理学会ゲーム情報学研究会若手奨励賞、第21回ゲームプログラミングワークショップ優秀論文賞受賞。UECコンピュータ大貧民大会3連覇、他デジタルカーリング大会等の優勝経験もあります。現在はHEROZ株式会社のAIエンジニアとして、将棋プログラムPonanzaのプログラマを務める他、『囲碁ウォーズ』に搭載されているAI「棋神」の開発等を行っています。
https://github.com/YuriCat cute_na_piglets katsuki.ohto.AI.art