【世界初!Go言語とMySQL UDFで実現する超高速データ前処理/分析基盤】田野口 大樹 [ミーカンパニー]
ミーカンパニーは全国の「医療機関、薬局、介護事業所」データを収録したSCUEL(スクエル) Databaseを中心に各種事業を展開しています。
SCUEL
Database開発のために収集した各種オープンデータ・クローズドデータは数億件。この規模のデータを前処理する場合、大量のサーバで並列に処理させるのが現在主流でしょう。一方でリソースに乏しいスタートアップでは、クラウドであっても、資金的に大量のサーバを用意することは難しい現実があります。
ミーカンパニーは、サーバ1台で1億件のデータ前処理を3時間で捌くデータ前処理/分析基盤をGo言語とMySQL
UDF(ユーザ定義関数)で実現しました。Go言語+MySQL UDFで実運用する事例は世界初。常識を覆すデータ前処理の取り組みをご紹介します。
【無理をしない機械学習プロジェクト】犬塚 眞太郎 [クックパッド]
なるべくリソースを投入しすぎず、細かいサイクルで機械学習プロジェクトを回していく方法についての話です。実際にクックパッドで取り組んだ内容についてお話します。
【CNNで自然言語処理】田本 芳文 [シルバーエッグ・テクノロジー]
CNN(Convolutional Neural Network)は主に画像処理で使われるDeep Learningの一種ですが自然言語処理でも効果を発揮します。さらにCharacter-Level CNNという手法は分かち書きを必要とせず、自然言語処理で誰もが頭を悩ます誤字・脱字にも強いことがわかったので、その手法の説明と活用例をお話しします。
【ゼロからはじめる機械学習機能】今井 太宗 [Repro]
Reproはモバイルアプリの分析・マーケティングツールとして、これまでも大量のデータと戦ってきました。そしてさらなる価値提供のために機械学習を用いた機能開発を進めています。
そんな中で、サーバーサイドエンジニアだった私が機械学習分野に関わり、実際に機械学習を用いた“機能”をプロダクトに載せるまでに至った取り組みをご紹介いたします。
【司会】田野口 大樹 [ミーカンパニー]
ミーカンパニー株式会社
Golang Outstanding Data-engineer (GOD)
SIer、Webサービス企業など数社を経て、2017年にミーカンパニー株式会社に入社。SIer在籍時は医療系システム開発や、小売系ユーザー子会社での機械学習/IoTトライアルなどに参画。「すべてのバッドデータをAI/BIに与える前に消し去りたい」をモットーに、これまでの業務/コミュニティ活動で得たシステムアーキテクチャやアジャイル開発などの知見を投入して、バッドデータを相手に日夜奮闘中。
犬塚 眞太郎 [クックパッド]
クックパッド株式会社
2016年2月にクックパッドにアルバイトとして入社。サービス開発部でのサーバーサイドエンジニアを経て、2017年7月より研究開発部機械学習グループに所属。リサーチエンジニアとして、自然言語処理を用いたレシピデータの研究開発業務に従事。東京大学大学院情報理工学系研究科に在学中。
田本 芳文 [シルバーエッグ・テクノロジー]
シルバーエッグ・テクノロジー株式会社
2016年9月にシルバーエッグ・テクノロジーにウェブデベロッパーとして入社し、レコメンデーション結果分析ダッシュボードを開発。今年度よりレコメンデーションアルゴリズムの研究開発に従事。
今井 太宗 [Repro]
Repro株式会社
2016年1月にRepro株式会社に入社。サーバーサイドエンジニアとして、マーケティング機能や分散処理基盤を利用した機能の開発を続けています。7月からは、よりデータ分析・機械学習にフォーカスしたチームを立ち上げ、さらなる付加価値が提供できるよう奮闘中です。