【15-B-2】 ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデータ活用のかたち~

  

HadoopやSparkは、スタンダードな分析基盤として今ではすっかり定着しました。その上で、エンジニアにはPythonやRを使った機械学習などを求められるケースも多いかと思います。
また、従来のビッグデータではオフライン分析が主でしたが、Kafkaの台頭により、ストリームデータに対する要件も増えてきました。
本セッションでは、ストリームとバッチを融合したアナリティクスの事例紹介をベースにKafkaやHadoopでデータをストアし、Zeppelin上での機械学習をチュートリアル形式でお伝えします。
さらに、これからデータサイエンティストを目指す方のために、これらの環境を"タダ"で利用できるOracleのCloud環境も併せてご紹介させていだきます。

立山 重幸 [日本オラクル]

日本オラクル株式会社
クラウドプラットフォームソリューション統括 - Cloud Platform ソリューション本部 - Big Data & Analytics ソリューション部
Principal Sales Consultant

HadoopやSparkなど、ビッグデータ界隈に生息するセールスエンジニアです。元々は、管理会計や原価計算など、会計系DWH/BIの構築が専門。5年前からOSSに魅了され、今ではすっかりビッグデータな人になりました。キラキラしたアナリティクスな世界に憧れを持つが、現実的にはデータマエショリストを生業としています。