■ 本ポジションの採用背景
trocco®の専任SREはチームは立ち上げからまだ約1年で、ようやく足場が整ってきた、というような状態です。
これからSREとして信頼性向上のためにやるべきこと・やりたいことを進めていきたいフェーズではありますが、trocco®のプロダクト開発の拡大に伴い、開発チームをサポートし、運用面も念頭に置いた機能開発に関わることも増えてきております。
利用規模・機能の拡大スピードに関わらずユーザーに安心してかつ快適にtrocco®を利用してもらうために、一緒にサービスの信頼性向上の役割を担っていただける方を募集しています!
■業務内容例
・データパイプラインの実行スケジュールに対し、Kubernetes のノードをより効率的にスケールさせる機能の開発
・アプリケーション・インフラ監視体制の課題洗い出しと改善
・SLI/SLOの策定・改善とモニタリング
・インフラ利用コストと運用コストの最適化
・バグの調査とバグを早期発見するための取り組み立案
・SOC 2取得に向けたプロダクトセキュリティ対策の計画・実行
・CI/CD パイプライン改善
・利用者からの問い合わせ調査・サポート
(従事すべき業務の変更範囲)
会社の定める業務
■primeNumberでSREとして働く魅力
・グローバル展開していくデータエンジニアリングサービスのインフラを支える経験ができる
・利用者に計算資源を払い出す特殊なアーキテクチャに起因する、難易度の高い技術を扱える
・専任SREチームの立ち上げフェーズのため、チームを1から創る経験ができる
・ビジネスに近い距離でSREとして働く経験ができる
■プロダクト開発本部 組織構成
CTO 1名
PdM3名/ソフトウェアエンジニア9名/SRE 2名
デザイナー 2名/テクニカルライター2名
■SRE社員の記事
1人目の専任SREがポストモーテム文化を改善したらエンジニア以外にも広まり、他部門との連携も強化された話
https://note.com/tk3fftk/n/n241612789742
■開発環境
・言語
Ruby (Rails), Typescript (React), Java (Embulk)
・インフラ
AWS (EKS, ECS Fargateが中心)
・構成管理
Kustomize, Terraform
・監視
CloudWatch, New Relic, Redash, Rollbar
・CI/CD
CircleCI, GitHub Actions
・コミュニケーション
GitHub, Google Workspace, Slack, Confluence, Miro
・その他
Okta, 1Password
【必須スキル】
下記のすべてを満たす方
・Webアプリケーションの開発・運用経験
・AWS, GCPなどのクラウド技術を用いたシステム設計・開発・運用経験
・コンテナ技術、ネットワーク、Linuxに関する基礎知識・運用経験
・Terraform, Ansible, AWS CloudFormationなどを利用したIaCの実践経験
・何らかのOSSやSaaSを用いた監視設計・運用経験
・可用性・耐障害性向上に関する知識・経験
・チーム内外の人を巻き込んで物事やプロジ
【歓迎スキル】
・Ruby (Rails) によるアプリケーション開発経験
・大規模なKubernetesクラスタの運用経験
・世界規模で利用されるシステムの運用経験
・大規模障害への対応経験
・SREの基本的な概念 (SLI/SLO, エラーバジェット, ポストモーテムなど) の設定・導入経験
・コンテナ、ネットワーク、Linuxに関する深い知識・経験
・セキュリティドメインに関する知識・経験
・何らかのチームリード・マネジメント経験
【求める人物像】
・ コミュニケーションの重要性を理解し、チーム内のコミュニケーションを怠らない方
・ドキュメント化することの重要性を理解し、情報を残す習慣が身に付いている方
・広い視野と当事者意識を持ち、お節介がやける方
・属人化の削減やトイルの削減(自動化)が好きな方
・特定の技術にこだわり過ぎず、柔軟に取捨選択ができる方
・primeNumberのミッション・バリュー(8 Elements)に共感していただける方
https://primenumber.co.jp/recruit/
【働き方】
・フレックス制度あり<コアタイム11:00~16:00(休憩60分)>
・週中日2日までリモートワーク可
ビール・水・お菓子が無料になっており、社内交流が盛んです!