前回
cake-by-the-river.hatenablog.jp
今回は、細胞など医用画像のセグメンテーション(画像の中から細胞の部分のみを取り出す)で用いられる U-Net を見てみます。途中で FCN についても扱います。
U-Net
元論文:
arxiv.org
前回のAlexNetは、少ないサンプルでしか適用できなかったCNNを様々なテクニックにより大規模データセットにも利用できるようにしました。しかし、医用画像処理などの文脈では次の問題が残ってしまいます。
- 得たい出力は、画像の分類ではなく、画像内の特定の領域の抽出である(より正確には、元の画像で対応する領域のピクセルを選ぶ semantic segmentation)
このようなタスクに対し、MCDNN (Cirsan et al., 2012) などの手法が提案されていました。これらは、画像の局所的な領域(パッチ)ごとに予測を行い、その結果を統合するもので、実質的な入力数を増やせるなどの利点がありましたが、局所性に振ることで全体的な文脈の把握が困難となるというトレードオフや実行速度がネックとなっていました。
U-Net (Olaf et al., 2015) では、"Fully Convolutional Network (FCN)" (Long et al., 2014) と呼ばれる全く異なるアプローチを改良することにより、これらの問題を解決しました。
続きを読む