Tagbangers, Inc. / SRE
AWS EKS環境におけるOSSメジャーバージョンアップと互換性問題の解決
SREインターンとして、AWS上で稼働するEKSクラスタ環境において、各種OSSコンポーネントのメジャーバージョンアップ検証作業に従事しました。 具体的には、JavaやSwiftなどの言語ランタイムやミドルウェアをバージョンアップする際に発生する互換性エラーの原因究明と解決を担当しました。公式ドキュメントに記載のない依存関係の問題を、ソースコードレベルで調査し、APIの仕様変更や非推奨化による影響を特定しました。 バージョンアップの実施にあたっては、サービスの無停止を実現するため、AWS Application Load Balancer(ALB)の背後で動作するPodに対してメンテナンスページを表示させ、ユーザーへの影響を最小限に抑えながら、段階的にPodのイメージを更新しました。この際、ALBのターゲットグループを活用し、新旧バージョンのPodを並行稼働させながら徐々に切り替えるBlue-Greenデプロイメント的なアプローチを採用し、問題発生時には即座にロールバックできる体制を構築しました。 さらに、今後のバージョンアップ作業の効率化と品質向上を目的に、一連の検証・デプロイ工程を詳細にドキュメント化しました。具体的には、事前検証のチェックリスト、互換性確認の手順、デプロイ手順、ロールバック手順、トラブルシューティングのナレッジをまとめ、チーム内で共有可能な形で整備しました。これにより、属人化を防ぎ、他のメンバーでも同様の作業を再現可能な状態を実現し、チーム全体の運用品質向上に貢献しました。 この経験を通じて、本番環境でのバージョンアップにおけるリスク管理、互換性問題を体系的に調査・解決するスキル、そして運用ノウハウを組織資産として蓄積する重要性を学ぶことができました。