1
/
5

データサイエンティストと共にプロダクトの継続的な成長を支える推薦基盤チーム

Photo by Science in HD on Unsplash

Wantedly Visitの検索基盤チームの一條です。普段はData EngineerやMLOpsに取り組んでいます。

Wantedlyではユーザーと企業のマッチングをより良いものにするために募集検索やスカウトでのユーザーの検索を日々改善しています。
手段としては機械学習などを用いることで、マッチングの改善を行っています。

そのマッチング改善するのがMatching Squadというチームなのですが、ここにはデータサイエンティストと推薦基盤チームが存在します。

推薦基盤チームが必要な理由としては次の3つがあります。

  1. 推薦の施策を打つための実装
  2. データサイエンティストの生産性を上げるための仕組み・ツールづくり
  3. データ周りについて、社内特有の事情を理解した人が必要

それぞれ過去のストーリーなどを踏まえて説明します。それによって推薦基盤チームの必要性を理解してもらえると嬉しいです。

推薦の施策を打つための実装

データサイエンティストによる成果を具体的なプロダクト組み込むためには、バックエンドのスキルを持つエンジニアが必要です。例えば私たちの普段の業務内容だと以下のようなものがあります。

  • データサイエンティストによる成果のプロダクト実装
  • プロダクトの継続的な開発のための環境整備
  • 分析やロジック改善のためのログ基盤の整備

例えばそもそも推薦の施策を打ちづらい環境から打ちやすい環境にするためにマイクロサービス化したり、見落としがちな速度についてもできるだけ立ち向かうための戦略を建てたりしています。

複雑なロジックと速度のトレードオフに立ち向かうための戦略と実践 | Wantedly Engineer Blog
はじめまして。Wantedly Visitの検索基盤チームの一條です。普段は検索の改善に取り組んでいます。 Wantedlyではユーザーと企業のマッチングをより良いものにするために募集検索やスカウトでのユーザーの検索を日々改善しています。 今回はWantedlyの募集やスカウトでの検索の速度改善の取り組みについて書きたいと思います。 ...
https://www.wantedly.com/companies/wantedly/post_articles/310520
検索を改善しやすい環境をマイクロサービスで実現する | Wantedly Engineer Blog
はじめまして。Wantedly Visitの推薦基盤チームの一條です。普段はData EngineerやMLOpsなどに取り組んでいます。 ...
https://www.wantedly.com/companies/wantedly/post_articles/309758


データサイエンティストの生産性を上げるためのツールづくり

例えば、Argo WorkflowsやBigQueryの機能、gRPCといったすでに世の中にあるものや、すでに社内にあるものををデータサイエンティストも扱いやすい形に整える、といったことにも取り組んでいます。

Argoの依存管理に関しては今ではデータサイエンティストに変更してもらう、というフローがチーム内でできつつあったり、BigQueryのクエリの分散問題に対しても、データサイエンティストがviewを管理しやすい形になっています。

データサイエンティストと効果的にコラボレーションするためのインターフェースづくり | Wantedly Engineer Blog
はじめまして。Wantedly VisitのMatching Squadの推薦基盤チームの一條です。普段はData EngineeringやMLOpsに取り組んでいます。 Wantedlyではユーザーと企業のマッチングをより良いものにするために募集やスカウトでのユーザー検索を日々改善しています。 ...
https://www.wantedly.com/companies/wantedly/post_articles/309759
Server Reflectionが実装されていないgRPCサーバーでも簡単に叩けるCLIを作る | Wantedly Engineer Blog
はじめまして、Wantedly VisitのMatching Squadで推薦基盤の改善をしている一條です。好きな食べ物は二郎系のラーメンです。普段は推薦基盤の整備や、障害対応などをしています。そのため普段はGo、ときどきRuby, PythonでgRPCを書いています。その際にgRPCサーバのデバックが辛くなってツールを作成したのでその説明をします。 この記事は以前技術書典10でTech ...
https://www.wantedly.com/companies/wantedly/post_articles/310167
Argo Workflows: 推薦基盤向けワークフローエンジンを Kubernetes で運用して1年経ったので振り返る | Wantedly Engineer Blog
こんにちは。Matching チームの笠井(@unblee )です。 この記事では、おおよそ1年以上前に私が新卒入社して Infrastructure チームで一番最初に取り組んだ Workflow Engine の導入プロジェクトについての振り返り・供養をしようと思います。 記事内で触れている情報・判断は全て1年以上前の時点の社内外の状況に基づいていることを前提としているため現在の最新の情報とは異なることがあります。この前提を承知した上でお読みいただければ幸いです。 Wantedly では以前から推薦基
https://www.wantedly.com/companies/wantedly/post_articles/302473
BigQueryのクエリをコードとして管理する | Wantedly Engineer Blog
この内容はWANTEDLY TECH BOOK 9でも書いてあるのでぜひそちらも見てもらえると嬉しいです。 Wantedlyでエンジニアをしている一條です。普段はデータサイエンティストの人たちと一緒にプロダクトの改善であったりデータ周りの改善に取り組んでます。今回は個人的に作っている rerost/bqvというツールについて書きたいと思っています。これはWantedly社内で実際に導入して使っているツールです。 また社内で行った速習会のときの資料もあるのでそちらも合わせてみてもらえると嬉しいです。 また、
https://www.wantedly.com/companies/wantedly/post_articles/286165

データ周りについて、社内特有の事情を理解する

検索に手を入れるため、ある程度社内のドメイン知識や歴史的経緯などが身につきます。これによりデータサイエンティストにとって重要なことですが、ドメイン知識・歴史的背景説明することであったり、それを元に不明なロジックやデータを調査する、といったことができます。
これは実装していた人などでもできますが、データサイエンティストにとってはある程度相互理解している人が説明することでコミュニケーションロスが減らせると考えています。

これについてはストーリーにはしていないですが、社内で一つの単語に対して複数の意味づけがあったものに対して調査・整理し、ドキュメントにまとめる、といったこともしていたりします。

最後に

そもそもこういったことは、ある程度データサイエンティストと推薦基盤チームが密に連携が取れていることで実現できていることなのかなと思います。

これからも、こういったことは取り組んでいきますし、また基盤としては現在必要なものは揃えられたと思いますが、問題は問題を解決するたびに湧いてくるもので、かつそれはコスパが高いものでした。今後は問題を問題と認識される前に倒し、よりデータサイエンティストの生産性を伸ばすことでプロダクトの成長を支えたいと思っています。

Wantedly, Inc.では一緒に働く仲間を募集しています
9 いいね!
9 いいね!
今週のランキング
Wantedly, Inc.からお誘い
この話題に共感したら、メンバーと話してみませんか?