競プロとか

SIIM-ISIC Melanoma Classification 参加記録

Kaggleを始めた

前々から気にはなっていたが、機械学習に興味が持てなく競プロに熱を割いていた
ただその競プロも緑帯に入ってから伸び悩み、楽しくなくなっていた
もっとも3週間の予定で入っていたインターンがコロナで消滅して、暇になったから丁度良いと思って始めた

コンペ概要

本コンペは数ある画像データから、メラノーマ(悪性黒色腫)であるかどうかの確率を推定するものである。 コンペに出たことが無かった為、テーブルデータが出来れば良かった が無いものは無いので、ある程度参加者が多くnotebookが参考になりそうな、メラノーマコンペを選んだ次第

解法

何も分からないから、ひたすら公開されているnotebookを読み解いた

www.kaggle.com

www.kaggle.com

www.kaggle.com

上記、3つのnotebookを中心的に読み解いた

その中でも一番下の"Analysis of Melanoma Metadata and EffNet Ensemble"は、メタデータの解析を非常に丁寧に行っており参考になった

そのnotebook内ではXGBを使用しpublic score: 0.8484もの精度を出していた

全体を通じて、外部からデータを引き込み更にaugmentさせ、EfficientNetに流し込む流れが主流である(多分)

但しnotebookによって使用するEfficientNet B0 ~ B7の選択が異なり、何に依存しそもそもB*とは何なのか(スケーリングによるものらしい)、という感じであった

そのため微妙にモデルが異なるため、最終的には人力でEnsembleを行い、最適な結果となるようパラメータ調整を行っていた

f:id:Radperia:20200827143940j:plain

結果

public LB: 890位からprivate LB:74位と816位ものshake upで何故か銀メダルを取れた

f:id:Radperia:20200827143349j:plain

これはコンペ中にも思っていたが、妙に投稿数が少ない割に同一のpublic scoreを持つ参加者が多かった

最終的には秘密裏に提出データを金銭でトレードしていたらしく大量のBANとオーバーフィットによる(多分)shake upが発生していた

複数モデルから最終的な結果を調整したのが功を奏したと思っている

ただ本当に何も分からないので、今回を機に色々と知見を深められればと思う