画像認識入門(シリーズ機械学習の数理)
2021年3月開講講座の録画販売についてお申し込み受付中です。
講座の概要
この講座はシリーズ機械学習の数理の3月分です。
画像認識は、画像のなかに写っているものをコンピュータで識別できるようにする技術です。この作業は人間にとっては難しくありませんが、それは無意識のうちに画像から、その文脈を読み取ることができるからです。画像認識の本質的な難しさは、コンピュータにこの文脈をどう把握させるかということにあり、それは「セマンティックギャップ」とよばれています。
参考:Nicolò Valigi, A review of deep learning models for semantic segmentation
一言で画像認識といっても、さまざまなタスクに細分化することができます。例えば、以下のようなものがあります。
・クラス認識 : 写っている物体のクラスを推定する
・物体検出 : 写っている物体のクラスを推定し、その領域を枠で囲む
・セマンティックセグメンテーション : 写っている物体のクラスを推定し、その領域を他の領域と細かく塗り分ける
機械学習は画像認識技術の大きな貢献を与えてきましたが、畳み込みニューラルネットワーク(CNN)の貢献は特に無視できないものでしょう。この講座では、クラス認識・物体検出・セマンティックセグメンテーションについてCNNを応用した代表的な手法を紹介します。
受講にあたって
受講する上で必要な知識
・畳み込みニューラルネットワークの基本的な知識(c.f. Deep Learning入門)
・keras, PyTorchいずれかの使用経験(授業ではkerasを用います。)
※畳み込みニューラルネットワークについては、授業中に短い復習をおこないます。
カリキュラム
1日目 :
A. 画像認識とは何か
画像認識の歴史、画像認識の難しさ、画像認識のさまざまなタスクについて説明します。また、画像認識の機械学習においてよく用いられる前処理として、PCA白色化やZCA白色化を紹介します。
B. クラス分類
CNNによるクラス分類を復習し、ImageNetによる転移学習・ファインチューニングを紹介し、kerasを用いた実装の方法を解説します。また、畳み込みニューラルネットワークの説明可能性の話題から古典的な手法であるGrad-CAMを解説します。
2日目 :
C. 物体検出
物体検出のモデルの評価の方法を紹介します。また、物体検出におけるCNNの応用のなかから、Faster RCNNとYOLOを紹介します。YOLOについてはkerasを用いた実装の方法を解説します。
D. セマンティックセグメンテーション
セマンティックセグメンテーションにおけるCNNの応用のなかから、U-Netを解説し、kerasを用いた実装の方法を解説します。また、Oxford-IIIT ペット・データセットを用いたデモを行います。
名称 | 画像認識入門(シリーズ機械学習の数理) |
---|---|
講師 | 内場崇之 |
日程 | 計2回の集中講義になります。 第1回 3月14日(日) 10:00-15:00 第2回 3月21日(日) 10:00-15:00 |
場所 | Zoomによるオンライン講座となります。 |
教科書 | 講師オリジナルテキスト ※ テキスト代は受講料に含まれています。 |
受講料 | 全2回34,500円 クレジットカード支払いはこちらのページから。 |
持ち物 | ・筆記用具 ・Pythonをインストールしたパソコン |
お申込み
お申し込みは、以下のお申込フォームからお願いします。
※お手数ですが、件名について『画像認識入門』を選択のうえ送信をお願いします。