over 3 years ago

這篇主要是提出一個方法,去解決傳統的dimension reduction的方法,如PCA(Principal component analysis),與MDS(multidimensional scaling),在nonlinear的dataset上做得並不好的缺點。

上面的table1是整個演算法的流程,其實看起來複雜但idea並不難,分成下列幾步來說明。

1. 建出neighborhood graph,方法有兩種,一種是對每個data point,找附近k個的nearest neighbor當成鄰近的node,或是找一定的距離內的data point當鄰近的node
2. 找出all pair shortest path,方法是有相連的兩個node會給定一個相同的weight,反之則是無限大的weight,每個回合都去找dij = min{dij,dik+dkj}。
3. 重建d-dimentional embeddings,類似approximation。

如此這般,isomap就同時有了PCA和MDS的優點們,在nonlinear的dataset上也可以有效率而準確的去學到那個manifold。

← [paper critique] A Survey on Transfer Learning [Paper critique] Spectral Hashing →