博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
聚类和降维
阅读量:4304 次
发布时间:2019-05-27

本文共 577 字,大约阅读时间需要 1 分钟。

1.何为聚类

        聚类是用于寻找数据内在的分布结构。既可以作为一个单独的过程,如异常检测等;也可作为分类等其他学习任务的前驱过程。聚类是标准的无监督学习。

        在一些推荐系统中需要确定新用户的类型,但“用户类型”这个概念可能无法精确定义,此时往往会先对原有的用户数据进行聚类。然后根据聚类的结果将每个簇定义为一个类。然后在基于这些类别取进行相应的分类训练,以判断新用户的类型。

2.何为降维

        降维主要是为了缓解维数灾难的一个重要方法。

        主要是通过数学变换将原始的高维属性转变到一个低维的子空间。虽然人们平时观测到的数据基本都是高维的,但实际上真正与学习任务的分布相关的往往是低纬度的分布。所以,一般可以通过最主要的几个特征维度就可以实现对数据的描述。如kaggle上的泰坦尼克号生还问题。其主要是通过给定一个人的许多描述特征如年龄、姓名、性别和票价等来判断其是否能在海滩中生还。这就需要先进行特征筛选,从而找出主要的特征,让学校到的模型有更好地泛化性。

3.异同

        (1) 聚类和降维都可以作为分类等问题的预处理步骤。

        (2) 但他们虽然都可以实现对数据的约减,但二者使用情况不同。聚类针对的是数据点,而降维针对的是数据的特征。

        聚类常见的有k-means,层次聚类,基于密度的聚类等;降维中常见的有PCA、Isomap、LLE等。

 

        本文摘自“深度学习500问”。

转载地址:http://auhws.baihongyu.com/

你可能感兴趣的文章
学生档案
查看>>
/sys/bus/i2c/devices下的内容与i2c_board_info结构体
查看>>
Python高级正则
查看>>
【转】 linux系统的7种运行级别
查看>>
弹幕和回到顶部前端web
查看>>
activemq---点对点/发布订阅模式简单代码示例
查看>>
Win7 不能双击直接打开.txt .java 文件
查看>>
ElasticSearchwindow下搭建
查看>>
nginx之正向代理
查看>>
kubernetes之coredns玩法
查看>>
Shell常用命令
查看>>
Express使用html模板
查看>>
ie6兼容问题2——3像素间距
查看>>
简洁的JS实现Tab切换效果
查看>>
C# 使用Emit实现动态AOP框架 (三)
查看>>
第五次作业周总结
查看>>
个人报告04
查看>>
一次http完整的请求tcp报文分析
查看>>
MySQL错误: could not retrieve transation read-only status server
查看>>
iOS中sqlite和coreData的区别
查看>>