服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

如何对聚类分析做可视化?

2020-12-28 10:36:59 阅读(186 评论(0)

问题是,当数据没有标签或少量标签时,我们需要使用聚类分析来找到数据模式。了解聚类分析的结果或效果,如何可视化聚类分析?解决方案的第一步:安装和加载聚类分析R包-factoextralibrary(pacman)p_load(factoextra)第二步:导入数据集,使用R语言自带的USArests#导入数据集data("USArrests")#理解数据集?USArrests#数据集检查head(USArrests)第三步:数据集的准备和处理,数据集的标准化处理,每列为0,标准差为1df<-scale(USArrests)head(df,第四步:聚类分析及可视化。无论是层次聚类还是分类聚类,都要找到距离度量。然后根据计算后的距离,采用不同的策略收集数据。4.1基于相关系数的距离度量和可视化res.dist<-get_dist(df,method="pearson")head(round(as.matrix(res.dist),2))[,1:6]#可视化相关系数矩阵fviz__dist(res.dist,lab_size=8)4.2增强分层聚类和可视化res.hc<-eclust(df,"hclust")fviz_dend(res.hc,rect=TRUE)#树图fviz_____cluster(res.hc)#fviz_散点图silhouette(res.hc)#轮廓图分层树图聚类散点图轮廓图4.3增强K平均值聚类和可视化res.km<-eclust(df,"kmeans",nstart=25)#聚类散点图fviz_gap_stat(res.km$gap_stat)#Gap统计图在不同K值下指导选择最佳K值fviz_silhouette(res.km)#轮廓图,各聚类下的分布情况聚类散点图不同K值Gap统计图轮廓图K平均结果可视化的其他表达方式p_load(cluster,fpc)plotcluster(USArrests,res.km$cluster)clusplot(USArrests,res.km$cluster,color=TRUE,shade=TRUE,    labels=2,lines=0)如何查看聚类结果的详细信息,如何对K均值聚类的中心点进行可视化分析

内容来源:数据人网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

最新文章