【機械学習エンジニアの悲喜交々：後篇】導入から運用ノウハウまで。FIVEのシステムを作り上げてきた精鋭エンジニアが語る機械学習の現場

中根めぐ美, 牟田秀俊他3人

Creative Development Manager, エンジニア

中根めぐ美

ファイブ株式会社 / Creative Development Manager

フォロー

牟田秀俊

ファイブ株式会社 / エンジニア

フォロー

Ruichi Kousuke

エンジニア

フォロー

Takayuki Sato

エンジニア

フォロー

小西祐介

エンジニア

フォロー

on 2018/06/11

FIVE は「動画配信テクノロジー」と「モバイルファースト・クリエイティブ」を組み合わせて、スマートフォンでの映像流通を一手に担う事業を展開しています。

そんなFIVEが「life at FIVE.」と題し刊行するインタビューシリーズ。

前回は「機械学習の悲喜交々」と題し、機械学習開発に向き合っているFIVEエンジニア陣の本音を赤裸々に語っていただく座談会の前半の模様をお送りいたしました。

後編にあたる今回もCEOの菅野が聞き手となり、「機械学習」と呼ばれる技術開発においての嬉しさ、その裏に隠されている人知れぬ努力、運用の泥臭さを、FIVEエンジニアの赤裸々な本音と共にお届けいたします。

＜前半の模様は記事は以下のリンクより＞

【機械学習エンジニアの悲喜交々：前編】導入から運用ノウハウまで。FIVEのシステムを作り上げてきた精鋭エンジニアが語る機械学習の現場 | ファイブ株式会社

FIVE は「動画配信テクノロジー」と「モバイルファースト・クリエイティブ」を組み合わせて、スマートフォンでの映像流通を一手に担う事業を展開しています。そんなFIVE社が「life at FIVE.」と題し刊行するインタビューシリーズ。＜前回までの記事は以下のリンクより＞これまで三回に渡り、個々人のバックグラウンドからビジョンまでを中心にお送りしてきた「life at ...

https://www.wantedly.com/companies/five-corp/post_articles/121242

座談会参加エンジニア

インタビュアー／ファシリテータ―
菅野圭介 CEO

とりあえず出来る限りの事をひたすらやる。「出来る限り」というポイントを何処に置くかも重要

菅野：広告システムは、機械学習の適応分野としては一番先に来た領域だと思っています。実際にデータ量だったり、モデルの精度が競争力になる現場でもありますので。その上で我々はそこを強みにしようとしてる訳なんですけど、「じゃあ機械学習って具体的に何をやってるの？」という部分に興味を持たれる方々もいらっしゃると思うんです。FIVEが今実施している機械学習の定義をわかりやすく伝えるとなんでしょうか？

エンジニア一同：「売上を上げる、コンバージョンレートを上げる」。

菅野：ですよね（笑）。

小西：興味のありそうな人に合った広告を出すことで、コンバージョンレートも上がります。その結果クライアントにもメディアにもハッピーになってもらえるという意味合いですね。

類地：毎日追っていく指標があって、それを毎日きちんと追えるような仕組みを作るだとか。それがまともな値であるのかを検証するだとか、それを新しい指標を追加して毎日見られるようにするだとか。そこで何か問題が起こったりすると、定型的な分析ではなくもうちょっと細かく深堀りする分析というのも大事になってきます。

佐藤：僕らには元々機械学習導入前提ではなく作成したスコアラーがあって、それを改善する方法として機械学習を使っています。最初は最低限なモデルを作って、そこから売上に一番繋がるシグナルが何処なのかという分析をして、どこが一番システムの向上に繋がるのかを調べて、それを実際に確かめてみて---という流れを繰り返している感じです。

菅野：元のスコアラーは、戦う相手としては結構強かったと。

佐藤：そう、ですね(笑)。

菅野：「案外、人間のカリカリ・チューニングもやるなぁ」みたいな？？(笑)

一同：(笑)

小西：さっきの出たログの話に関連しますけど、「キャンペーンをどこに配信してみたら結果はこうなりました」というノウハウは社内に沢山あったので、そこの経験値から「だいたいこういうことすれば効果出るよね」という肌感が事前に見えていたみたいな感じでした。

菅野：モデルを作る前に、ログから下分析をするというのがファーストステップだったと。

小西：そうですね。それが一番大切な事だと思っていました。

佐藤：あと、広告業界だと、先人企業から生まれて積み重なってきた知見があるので、それを参考にしてどう進めるかを検討したりとか。

菅野：色々な論文を読んで、リサーチして。

佐藤：そうですね。結構、狭い業界なので、だいたいみんな見ているものが同じだったりとかします。

小西：自分で調べたつもりだったんだけど、結局みんな同じところにたどり着くという (笑)。

菅野：さっきの車輪の再発明的な感じにも聞こえるんだけど(笑)

一同：(笑)

小西：全員がきちんと論文を読んでいますね。FIVEのエンジニアは大半がコンピューターサイエンス出身の人ばかりなので。

菅野：わりと泥臭い細かな検証を積み重ねていくという話な訳ですが、予測が大きく外れるとか結果が伴わないことも多いと思います。そういう時に次に繋げていくためにはどういった手を打っていきますか？

小西：実際に配信したアルゴリズムの結果はすべてログとして残っているので「こうなる筈だったのに何故こうなっているんだろう？」ってひたすら調べたりします。

牟田：最近だと、トラフィックが全然出てないメディアの分析を行ったら、その原因が「始業式が始まっていた」っていう結論に行きついたケースがありましたね(笑)

菅野：ははは(笑)

牟田：あ、そうか。今まで春休みだったのか！っていう(笑)

小西：そういう僕たちにはどうすることもできないことも確かにありますね(笑)。あとは「このキャンペーンを配信すれば効果の向上に繋がる」という機械学習のロジックが働いた結果、同じキャンペーンだけを出し過ぎてしまって効果が落ちてしまったというケースもありました。そこを今度は影響が出過ぎないような設定を適用したりもしています。

菅野：学習が効きすぎた結果、逆にそれが偏りを生んでしまうというのは結構頻出しますよね。

佐藤：「外的要因で効果があまり良くなかった」という結果が出てしまう一方で、きちんとそこをガードする別のシステムを用意して今はカバーしています。

菅野：確かに、過去事象の学習＝機械学習な訳だから見当違いになってしまうこともあると思うんですけど、効果が見込めなかった場合にどのようなアプローチがあるのでしょうか？

佐藤：まずは分析をしてどこに原因があるのかを切り分けることが重要だと思います。それが「始業式」のようにある程度予測可能なものであれば一度経験すれば対策をたてられるので。「何かがバズってコンバージョンが急にいっぱいでてる」というような本質的に予測が難しいケースでは、最新のデータへの追従を素早くするとか人手で運用しやすい体制を整えておくといったことが効果的ではないかと思います。

小西：とりあえず出来る限りの事をひたすらやるという。その「出来る限り」というポイントを何処に置くかも重要です。

「機械学習が新しい知見を教えてくれた」という瞬間に出会える

菅野：逆に機械学習に携わっていて気持ちの良い瞬間とかありますか？機械学習の現場で楽しい瞬間というか。

佐藤：仮説を立てて検証してモデルを作って、それを使って期待通りの結果に繋がった時は凄く気持ちが良いですね。まぁ…そこに至るまでが本当に大変なんですけど…(笑)。今は結果に繋がることが多いので、楽しくやっています。

類地：データを分析していると「あれおかしいな、なんだろう？」と思うことがあって、色々調べてみたら今まで見つかっていなかったバグが見つかったりして。「あぁ、そうか。データ分析じゃなくてデバッグしていたのか」ってなったりしますよね（笑）

「デバッグ(debug)」
プログラムをテストし、バグと呼ばれる誤りを発見し、取り除くこと。

菅野：また辛い話になっちゃった(笑)　

小西：いや、でも、バグを見つけられると嬉しいですよ！

一同：(笑)

牟田：機械が学習をするプロセスの中で、社内の人間が気づけなかった事象を検知したりすると、「あ、機械学習が新しい知見を教えてくれた」という瞬間に出会ったりします。それは純粋に嬉しいですし、楽しいですね。

菅野：なるほどなるほど。今の機械学習チームで大きなトピックとして、LINEによるグループ化に伴い膨大なデータを扱っていくフェイズにあります。

小西：絶賛パイプライン構築中ですね。

菅野：なかなかその規模のデータを扱えることなんてないですもんね。

小西：普通では触れられないデータですから、貴重ですね。

菅野：最後に、この座談会記事をご覧になられている方々に一言あればお願いいたします！では…佐藤さん！(笑)

佐藤：あ…はい！(笑)

えっと、この記事を読んでいただいて、興味を持っていただけたら是非ともエンジニアさんでもビジネス職の方でも気軽にお話しができればと思っています。最近は機械学習やデータサイエンスといった分野が流行っていますが、インターネット広告ほどデータが大量にあって機械学習の良し悪しが数字にダイレクトに成果としてでる業界は少ないのではないかと思います。また、実際の現場ではデータの前処理に時間をとられたり予想外の結果がでたりといった様々なハードルが存在していたりもします。その生々しい開発現場に真正面からチャレンジすることが好きな人でしたり、開発スピードやシステムへの負荷などののバランスを取りつつ配信サーバーの頭を良くしていく事を楽しめる方にとってはすごく快適な環境だと思います。

小西：確かにそうですね。あの、「機械学習は技術的負債の高利貸しクレジットカード」という論文があって…「機械学習を導入する事は簡単だけど、その後の運用がめちゃくちゃ大変なので、ひたすら技術的負債が増えていくから気をつけましょうね」という論文があるんです。エンジニアがきちんと機械学習を運用することができる環境作りをしていますので、作るだけではなく運用をするための技術も身に付くかと思います。

＜上記の論文はこちらのリンクより参照できます！＞
https://ai.google/research/pubs/pub43146

菅野：一般的なイメージは逆なんだろうけどね。「機械がやってくれるから運用も楽」という認識を持たれている方も多いと思います。

小西：「機械が何をやっているのかわからなくなってしまう」というのが本質なんだと思います。

菅野：“人間には何が起きてるのかわからなくなってしまう”という事なんですかね？

小西：そうなると改善が出来なくなってしまうので、そのような事象が起きないようにしましょう、と。

菅野：非常に生々しい感じで、良い座談会だったと思います。

以上、FIVEエンジニア座談会「機械学習エンジニアの悲喜交々」の模様をお送りいたしました！

今回は主に機械学習についてのお話しがメインでしたが、実際の現場ではそこだけに留まらない様々な領域にて挑戦を続けています。「こんな事できるかもしれない！」「自分はFIVEでこんなことをやってみたい！」などなど、少しでもご興味を持たれましたら是非とも一度FIVEへ見学に来てみてください！ご連絡お待ちしています！

ファイブ株式会社では一緒に働く仲間を募集しています

【機械学習エンジニアの悲喜交々：後篇】導入から運用ノウハウまで。FIVEのシステムを作り上げてきた精鋭エンジニアが語る機械学習の現場

中根めぐ美

ファイブ株式会社 / Creative Development Manager

開発システム機械学習エンジニア社員インタビュー

1 いいね！

ファイブ株式会社

ファイブ株式会社は最先端の動画配信テクノロジーと独自のクリエイティブノウハウを組み合わせてスマートフォンでの映像流通を一手に担うプロダクトを展開しています。 2014年にスマートフォン向け動画事業を世界に先駆けて創業し、 Google出身のエンジニア・データサイエンティストを中心とした高い技術力を背景に世界に先駆け、動画テクノロジーを開発し、現在国内でアプリユーザー（MAU）3,900万人、WEB月間ユニークユーザー8,200万人以上に動画を届けています。売上ベースでも2017年は前年比800%の成長を遂げ、また動画クリエイティブ制作チームを内製しており、「テクノロジー」と「クリエイティブ」を高い水準で統合することを大切にしています。昨年2017年の大きなトピックスとしましては、LINE株式会社との資本業務提携を行い、相互の強みを活かしたプラットフォーム連携により動画マーケティングに対する市場ニーズに対応し、より良質な広告配信実現の準備を進めることができました。そして今年2018年は、さらに飛躍する年となっていきます。ファイブ独自のテクノロジーとクリエイティブノウハウにより、2017年に集計した「1ユーザー当たりの月間動画広告再生時間」も、2015年当時に比べ5.1倍という数値に辿り着くことが出来ました。今ではこの数年の実績により、限定された業界だけでなく、数多くのクライアント様にご利用をいただいております。テクノロジー×クリエイティブ力によりユーザーの寄り良い映像体験の追求を行っていきます。それにより良質なモバイルメディアを支援し、強力なマーケティング手段を提供し続けていくことを目指しています。ファイブのプラットフォームについてより詳しく知るにはコチラ ▼THE MOBILE VIDEO FACT BOOK 2017 https://www.five-corp.com/factbook2017/

フォロー