本セミナーでは、コンピュータに視覚を持たせる技術であるコンピュータビジョンの主要な技術を概観する。コンピュータビジョンで扱われる手法は多岐に渡っており、初学者がその全容を一度に把握することは難しい。
そこで本セミナーでは、様々な手法とその応用例を幅広く紹介する。
なお、参考図書として、【Richard Szeliski, 「コンピュータビジョン ―アルゴリズムと応用―」,玉木徹 他訳,共立出版】を挙げておきます。
- コンピュータビジョンの概要と歴史
- 画像生成過程
- 透視投影
- カメラモデル
- レンズ歪み/光学
- 照明
- 反射モデル
- 画像処理
- 領域分割
- 動的輪郭
- レベルセット/クラスタリング
- mean shift
- k-means
- 混合正規分布 (GMM) /グラフカット
- 正規化カット
- 特徴点検出と特徴量
- Harris
- LoG
- DoG/スケール不変
- アフィン不変/SIFT
- HOG/マッチング
- 追跡
- レジストレーション (位置合わせ)
- 画像の位置合わせ/3次元点群の位置合わせ
- 直交Procurstes
- ICP/姿勢推定
- カメラ校正/ステッチング
- 運動推定
- オプティカルフロー/Lucas-Kanade/Inverse Compositional algorithm
- 運動からの形状復元 (SfM)
- ステレオ対応
- 形状復元
- Xからの形状復元
- 照度差ステレオ/アクティブステレオ
- イメージベーストレンダリング
- 視点補間/ライトフィールド/ビデオベースのレンダリング
- コンピュテーショナルフォトグラフィ
- フォトメトリック校正/HDR画像
- トーンマップ/超解像/マッティング/テクスチャ合成
- 認識
- 顔検出
- 人物検出/顔認識/特定物体認識/カテゴリ認識/大規模データセット