【19-B-2】 DMMのビッグデータ分析のご紹介 ~Sparkによるリアルタイムレコメンド~

DMMでは、SocialStreamをリアルタイムに分析し、注目度の高いワード、流行なワードを元にしたリアルタイムレコメンドシステムの研究を行っています。大規模なリアルタイム分析を実現するために、SparkStreaming、MLlib(機械学習)、GraphX(グラフ処理)による並列分散処理基盤の構築を行ってきました。さらに、形態素解析器やSolrを用いた自然言語処理を組み合わせることによる精度向上にも取り組んでいます。本講演では、これらシステムの構築の手順やサンプル等を用いて、わかりやすく説明します。

田中 裕一〔DMM.comラボ〕

株式会社 DMM.comラボ
CTO室

金融系・組み込み系・コミュニティサービス・ゲーム・広告等の各システムを経てDMMへ。DMM.comラボにおいて、検索システムの刷新、レコメンドエンジンの新規開発など、基盤技術の開発を担当しております。
サーバーサイド、フロントエンド、ミドルウェア、インフラと領域問わず、提案から構築・実装まで幅広くやらせてもらっています。その他OSSのcontributor等もやっております。今後より活動の幅を広げて行きたいと思いますので、どうぞよろしくお願いします。



加嵜 長門〔DMM.comラボ〕

株式会社 DMM.comラボ
CTO室

大学院で、地理情報や時系列情報を用いたレコメンドアルゴリズムの研究をしていて、2014年4月にDMM.comラボへ入社しました。最近では、ソーシャルグラフなどを用いてデータとデータのつながりを分析するためのグラフ処理やグラフデータベースに興味があり、SparkのGraphXを用いたレコメンドアルゴリズムの研究を行っています。