Kaggle: RSNA Screening Mammography Breast Cancer Detection コンペティション
Kaggle: RSNA Screening Mammography Breast Cancer Detection コンペティション 期間: 2022年10月〜2023年1月 役割: 個人参加(ディープラーニング初挑戦) 成果: Privateスコア0.41(上位10%, 銅メダル圏内)※規約違反により公式記録から除外 【コンペティションの概要】 目的: マンモグラフィー画像から乳がんの有無を二値分類するモデルの構築。 課題: データ形式: 医療用画像フォーマットDICOM。 クラス不均衡: 陽性(乳がん)画像が全体の約2%。 制約: ノートブック形式での提出、推論時間8時間以内。 【技術的アプローチ】 データ前処理: DICOM画像をPNG形式に変換。 Stratified K-Fold(5分割)を用いて、クラス分布を均等に保ったデータ分割を実施。 モデル構築: ConvNeXtV2(TensorFlowベース): 公開モデルと自作モデルを使用。 SE-ResNeXt50(PyTorchベース): 公開モデルを使用。 上記3種類のモデルを約15:15:70の割合でアンサンブル。 推論最適化: Rejection Method: 最初のモデルの予測結果を基に、陽性確率が高い上位25%のデータのみを後続モデルで再評価。これにより、推論時間を約540分から200分に短縮。 Test Time Augmentation: 輝度、コントラスト、JPEG品質のランダム調整や画像のランダムクロップを試行(最終的なスコアへの影響は限定的)。 【学びと反省】 技術的成長: ディープラーニング未経験からスタートし、短期間で複数のモデルを構築・評価するスキルを習得。 課題認識: 規約違反(序盤にチームメイトでない友人とノートブックを共有)により、公式記録から除外されたことを深く反省。 クラス不均衡やドメインシフトへの対応、外部データの活用方法など、今後の課題として認識。