
t-SNEとUMAPの仕組みとPythonによるデモ
この講座では、
1. 確率的近傍埋め込みが考え出された経緯の説明
2. t-SNEやUMAPの仕組みの説明
を中心に行います。また、パラメトリックt-SNEやパラメトリックUMAP、densMAPなどについても、何ができるようになったのかを焦点に解説します。
※アーカイブ講座の動画販売についてお申し込み受付中です。
統計・機械学習講座
スポット講座
Sスタンダード
アーカイブ講座(録画販売中)
この講座では、
1. 確率的近傍埋め込みが考え出された経緯の説明
2. t-SNEやUMAPの仕組みの説明
を中心に行います。また、パラメトリックt-SNEやパラメトリックUMAP、densMAPなどについても、何ができるようになったのかを焦点に解説します。
※アーカイブ講座の動画販売についてお申し込み受付中です。
変数が多いデータを理解することは容易ではありません。しかし、実世界のデータセットにはたくさんの変数が含まれています。かつてからベンチマークデータセットとして用いられてきたボストンの住宅価格のデータセットは14個の変数、乳がんのデータセットは31個の変数からなります。
私たちはこのような問題を「次元削減」で解決しようとしてきました。主成分分析(Principal Component Analysis)やその拡張である自己符号化器(AutoEncoder)はその代表的な手法です。
しかし近年、これとは異なる次元削減へのアプローチとして確率的近傍埋め込み(Stochastic Neighbor Embedding, 代表例はt-SNE)やUMAP(Uniform Manifold Approximation and Projection)が提案されました。
この講座では、
1. 確率的近傍埋め込みが考え出された経緯の説明
2. t-SNEやUMAPの仕組みの説明
を中心に行います。また、パラメトリックt-SNEやパラメトリックUMAP、densMAPなどについても、何ができるようになったのかを焦点に解説します。
すうがくぶんかのオリジナルテキスト
デジタルデータ(jupyter)をメール添付にてお送りいたします
前半ではt-SNEやUMAPを実際にPython言語を用いて動かしてみましょう。これらの手法に不慣れな人もいると思いますが、MNISTとよばれる画像データセットを用いてデモをすることでイメージを掴むことができると思います。後半では、t-SNE・UMAPの仕組みについて説明します。t-SNEやUMAPを考える動機は、データの分布の様子を低次元でも確認できるようにすることです。データが分布する様子をfuzzy位相表現というグラフで表し、これとなるべく似たfuzzy位相表現をもつ点の配置を低次元の空間で実現するというアイディアに基づいています。ここは内容の多い部分なので、2日目の前半に説明がまたがる予定です。
前半では1日目に続いて、t-SNEやUMAPの仕組みの解説を行います。さて、新しいデータ点が得られたとき、主成分分析ではその主成分得点を計算することが出来ましたが、t-SNEやUMAPではその点が次元削減した空間のどこに配置されるかを計算することはできません。この問題を解決するために提案されたのが、パラメトリックt-SNE・パラメトリックUMAPです。また、t-SNEやUMAPは点の周辺の密度の情報を破壊してしまうことが知られています。この問題に対処するために提案されたのがdensVisとよばれる考え方で、この考え方をt-SNEやUMAPに導入したものをdenSNE・densMAPといいます。後半では、これらパラメトリックt-SNE・パラメトリックUMAP・densVisの概要を説明し、Python言語によるデモを与えます。
講座名 | t-SNE・UMAPと次元削減:機械学習の数理シリーズ |
---|---|
担当講師 | |
開講スケジュール |
計2回の集中講義になります。 |
受講方法 |
Zoomによるオンライン講座 |
教科書 | すうがくぶんかのオリジナルテキスト |
受講料 | 全2回 税込34,500円 |
お支払い方法 |
クレジットカード支払いは本ページ下部「受講料のお支払いについて」よりお願いいたします。 |
準備物 | ・筆記用具 |
下記のボタンを押すと該当する集団講座のチケットをご購入いただけます。
※ボタンを押すと、stripeの決済ページへ遷移します。
全2回 |
---|
2020年前期分よりオンライン授業を録画し、授業の録画販売(アーカイブ販売)を行っております。
アーカイブ講座の動画購入をご検討いただく場合は、下記についてご確認をお願いいたします。
本講座は開講中の講座はございません。
アーカイブ講座(録画購入)にてご受講いただけます。
アーカイブ講座(録画購入)のお申し込みはこちら
講座名 | 動画内容 | 講師名 | 受講料 |
---|---|---|---|
t-SNE・UMAPと次元削減:機械学習の数理シリーズ 2021年後期 |
全2回 | 内場 崇之 | 34,500円 |
年度別 講座情報
年度 | 講座情報 |
---|---|
ー | 本講座は2021年後期のみの開講です。 |
講座のお申し込み・ご相談は
気軽にお問い合わせください。