淘先锋技术网

首页 1 2 3 4 5 6 7

降维算法?

1.TSNE

算法思想:

(1)SNE,其基本思想为在高维空间相似的数据点,映射到低维空间距离也是相似的。算法利用距离表达两个点之间的相似性。常用的距离度量方式是:欧式距离。

(2)t-SNE,做出的优化是用t分布取代SNE中的高斯分布,使得降维后的数据,同类之间更加紧凑,不同类之间距离加大。换言之,对应于无监督聚类指标轮廓系数更好。

2.PCA

算法思想:将原有的n个特征,投影到k为空间,k维度空间之间两两正交称为主成分,新的特征由原特征变换而来。

算法实现:

在python中通过调用模块sklearn,两者都是封装好的函数,参考函数文档调参即可。