Excel可视化,如何展示一个完整的数据分析?
2020-12-28 14:13:05 阅读(764) 评论(0)
今日本文讲实操,教大家用Excel做一个简单的分析。一是让大家知道数据分析是一个什么样的过程;其次,熟练操作Excel(使用所学知识),包括公式、数据透视表等。在这里,我用Python在智联招聘中爬取了大约1800名BI工程师的工作信息,并用CSV文件保存了工作名称、公司名称、工资、城市、行业、学历要求、工作年限等关键信息。爬行过程不会重复,源数据附加给您,公共账户(数据分析不是一件事)回复“数据”可以获得操作版本:Excel2016,WIN10完整的数据分析需要经历以下步骤:数据获取-我用Python爬;明确分析目的——你得到什么信息,解决什么问题;观察数据-每个数据字段的含义,中英文解释;数据清洗-无效值、缺失值、重复值处理、数据结构是否一致等;分析过程-围绕目的进行分析;制作可视化-制作图表并制作可视化报告。第一,明确目的数据分析的禁忌是不知道分析的方向和目的,拿着一堆数据不知所措。第一,明确目的数据分析的禁忌是不知道分析的方向和目的,拿着一堆数据不知所措。数据用来解决什么问题?汇总统计制作成报表吗?是数据可视化,作为信息图吗?验证某种业务假设?KPI希望提高某一指标?要知道所有的数据分析都是以业务为核心目的,所以要找出业务问题的思考点。关于发现问题的切入点,之前的数据分析思维文章已经讲过了。永远不要试图在一堆数据中找到结论,目标在前面,数据在后面,即使数据是平均比较,也比没有方向好。每一次尝试都会引起进一步的思考,比如为什么这个值这么低,原因在哪里,差异波动的规律是什么...所以,在分析之前,我们不妨先看看我们爬的数据:假设我是BI工程师,我想知道:目前BI工程师的平均工资水平是多少,各地区对BI工程师的需求是多少,哪些地区岗位最多。BI工程师在不同年限的工资差异如何?三年后我的价格是多少?薪水较高的公司有哪些?有了这样的问题,我们的分析就有了方向,后续的过程就是把目标分解成实际的分析和展示。第二,要了解数据概况,首先要看数据。你想要的所有数据都不完整,可以分析哪些数据。主要是看数据字段,了解数据字段的含义:JobName——工作名称Company-公司名称Salary-工资City-城市Jobtype-工作领域Edulevel-学历要求WorkingExp-工作年限要求3.数据清洗,然后进行数据清洗。数据清理一般包括无效值、缺失值和重复值处理;数据是否有乱码和错位;数据口径问题,两张表的相关ID名是否一致;是否有统一的标准或命名,如公司名称的全写或缩写。数据转换是将数据规则为统一格式处理。因为这只是Excel级别的数据分析,而且只是一个简单的数据表,不会有太多复杂的操作。这里简单总结一下。1、缺失值数据会极大地影响分析结果。数据缺失的原因有很多,比如数据采集时,由于技术原因,爬虫并没有完全被捕获。但更多的工作原因是数据存储时没有完全收集,没有填写遗漏,这是数据规范数据治理的话题。一般来说,如果某个字段的数据缺失超过40%~50%,则没有分析意义,考虑删除或采取其他措施。只要在Excel中选择这个列来查看数据是否缺失。edulevel有缺失(1759/1800),但不多,不影响实际分析。2、脏数据处理发现,jobname列中有一些类似BIM工程师的岗位信息,应该是土木工程行业的工程师,爬的时候没有做过滤,包括“bim”“BIOS””BIW”等字段。在这里,我建立了辅助列,设置了判断条件,然后进行筛选和过滤,因为它包含了多个过滤。=IF(OR(COUNTIF“*”“A5”&{“bim”,”BIM”,”BIOS”,”BIW”}&"*"),1,"0"″)公式意味着,如果这些字段中的任何一个都是1,否则就是0。在这里,我们需要筛选结果为0的数据,总共筛选了600多个,数据还是很脏的。数据选项卡中的高级筛选功能也可以用于多重筛选。3、重复数据重复数据通常处理唯一的识别字段,如用户ID、订单ID和公司ID。这些字段代表了这一行中唯一的数据。严格来说,这里的表应该有公司ID字段和数据爬行的问题,所以我懒得再爬了,所以我会重复Company字段。这里有一个快速提示,使用Excel删除重复项功能,快速定位是否有重复数据。删除company列重复项:只剩下562个值。到目前为止,一些脏数据已经基本清理干净。最后,salary有一些“薪资面议”、“校招”的数据,这里也一起过滤掉了。Jobtype过滤掉了汽车、电子等行业,只留下了包括IT互联网行业在内的不到500条数据。4、Salary的工资用几K表示数据再处理,这是文本,不能直接用于计算。而且还是一个范围,后续要按照最高工资和最低工资分成两列。由于城市字段中存储的数据是“城市-区域”格式,如“上海-徐汇区”,为了便于分析每个城市的数据,最终增加了“城市”,截取了“-”前的真实城市数据。为了便于分类,区分原始数据,防止原始数据丢失,将以前处理过的数据复制并粘贴到另一个表中。①将salary分成最高工资和最低工资的工资处理方法有三种。一是直接分列,以“-”为拆分符,获取两列数据,然后用替换功能删除k字符串。得到结果。二是自动填充功能,填充内容自动计算填充所有列。三是利用文本搜索,重点*这一点。写公式的想法是先找到第一个K的位置,然后-1,去除K。因此,公式是:=LEFT(C2,FIND(“K“,C2,1)-1)同样的想法,最高工资需要用find找到”-“位置,然后截取从”-“到最后第二位的字符串。=MID(C2,FIND(C2,1) 1,LEN(C2)-FIND(C2,1)-1)这里,在新增数据列,平均薪水,来近似代表实际的准确薪资。平均工资=(工资下限) 工资上限)/2,即可获得每个岗位的平均工资。②由于存储在城市字段中的数据是“城市-区域”格式,如“上海-徐汇区”,为了便于分析每个城市的数据,最终增加了“城市”,并在“-”之前拦截了真实的城市数据。=IF(COUNTIF(G2,*-*)=0,G2LEFT(G2,FIND(“-”,G2,1)-1)到目前为止,所有的数据都已经清洗加工完毕,食材都准备好了,下面就可以正式开始数据可视化食品下锅烹饪了。四、分析过程分析过程有很多游戏玩法,因为这里的主要数据是文本格式,数据非常简单,所以倾向于总结统计的计算。若数值型数据较多,则涉及统计、比例等概念。如果有时间数据,就会有趋势和变化的概念。使用数据透视表完成整体分析,首先使用数据透视表获得汇总统计。1、本文简要介绍了BI工程师需求概况分析,增加了增材的区分,增加了数据大小的识别度。(条件格式-色阶)北京、上海、广州、深圳的BI工程师岗位似乎远远超过其他城市,其次是成都、杭州、武汉的梯队。1~3年和3~5年经验差距相当。2、BI工程工资分析每个经验年龄的平均工资状况,差距梯度仍然很明显。目前市场上BI工程的工资主要在7~17K左右。23~26K,应该是5~10年左右经验的岗位。3、随着经验的增长和教育影响力的整体规模,BI工程师大专和本科的工资差异不是很大。经过3~5年的经验,本科课程略有优势。到5~10年,基本拉平,也就是说学历因素影响比例较弱,这个时候更注重经验。其他分析过程没有重复,主要是使用数据透视表和数据透视图进行多维(城市、教育、工作经验)分析,没有其他复杂的技能。关于数据透视图和数据透视表。选择要分析的数据列。2013年以上的Excel基本上智能地帮助您推荐图标并生成透视界面。只要您区分拖动的字段是否到达列,您就可以到达值或行。然后根据情况对多数据进行一定的筛选,因为数据清理不一定很彻底,所以在制作过程中忽略了一些字段的空缺值,回头过滤。最后,一个简单的数据分析基本结束了。由于数据简单,不涉及数据集成、表合并、专业数据统计回归等操作。整个数据分析过程中最耗时的数据清理约占70%。只要目的明确,可视化分析师就很简单。其次,也可以看出,Excel的分析更多的优点是数据的简单处理。通过随机过滤、查询和定位,可以了解数据的概况。然而,在可视化方面,很难选择行列值和制作复杂的图表。总结Excel可视化需要一些时间才能做好。因此,当我进行分析时,基本上就是用Excel看数据全貌,简单处理一下。BI仍将对分析、可视化等进行分析。以后,我会再出一个BI制作的教程。
推荐阅读
- 全网营销推广怎么做?分为哪几个渠道?
随着时代的发展,网络营销在现代生活中越来越重要,甚至成为电子商务最重要的组成部分,对整个营销产生巨大的冲击。网络营销,是以互联网络为载体,以新的方式、方法和理念实施营销活动,更有效地促成个人和组织交易活动的实现。那么让我们了解全网营销推广怎…查看详情
- 比较靠谱的微信好友恢复系统有哪些?
当你刷机误删朋友的微信,你不要慌张,可以通过好友恢复系统找回来。但是目前的软件市场上,有很多自带病毒的恢复软件。那比较靠谱的微信好友恢复系统有哪些?有需要的小伙伴可以看一看哦。 1.恢复大师 它是一款非常专业的数据恢复软件…查看详情
- 大辽是现在的哪个地方
大辽,相信对于许多人来说,并不是一个常见的词汇。它曾经是中国古代的一个著名的国家,位于今天的东北地区,也就是中国边疆的重要区域。今天,尽管这个国家已经消失了,但是它的历史和文化却一直被人所研究和传承着。 一、大辽的地理位置 大辽是中…查看详情
- 免费字体管理工具有哪些 免费字体管理工具排行榜
相信做设计的小伙伴会涉及到很多字体这一块,现在很多的字体都是需要收费的,下面*就给大家来详细介绍一下免费字体管理工具有哪些 免费字体管理工具排行榜这一块的内容,希望能帮助到大家! 免费字体管理工具排行榜 1、《免费字体下载》 在这…查看详情
- 线上服务不只是客服,电商系统满足购物体验也是服务要求
电商市场拓展快速,队伍也在逐渐壮大,不同类型的电商平台层出不穷,同一类型的电商平台数不胜数。当下,企业进行电商系统开发的时候,不仅要明确企业自身的电商系统要求,更要满足消费者对电商系统的要求。毕竟,得人心者得天下,虽然线上购物没有线下实体店…查看详情
- 好看的都市言情小说有哪些 好看的都市言情小说完本推荐
现在很多的书友特别喜欢看都市言情小说,很多的人对此比较痴迷,下面万商云集小编给大家来详细介绍一下好看的都市言情小说有哪些 好看的都市言情小说完本推荐,不知道下面推荐的这些小说有喜欢的没有。 第一本:《离婚365次》作者:两颗心的百草堂…查看详情
- 有哪些实用性较高的空压机品牌
像有些从事螺旋行业的人就会非常需要空气压缩机,但是对于从事这一方面的人可能会没有经验,不知道应当选择什么空压机品牌,如果想要选择一个性价比高又实用的空压机品牌的话,可以看下推荐。1、捷豹空压机捷豹空压机致力于为用户提供性能优良的空气压缩机,…查看详情
- 壁纸软件哪个好 壁纸软件排行榜前十名
现在大家都喜欢炫酷的电脑桌面或者会给自己的手机设计收藏壁纸,但是市面上的壁纸软件是很多的,差别也是很大的,下面万商云集*给大家来详细介绍一下壁纸软件哪个好 壁纸软件排行榜前十名这方面的内容。 1.壁纸多多 高清壁纸大全,轻松设置,支持锁…查看详情
- 工商变更网上操作流程
一、前言 随着互联网技术的发展,越来越多的企业开始使用网络进行办公以及经营活动,工商变更业务也不例外。如今,企业可以通过在网上操作,实现工商变更,减少繁琐的手续和时间成本。本文将详细介绍工商变更网上操作的流程和注意事项。 二、流程 …查看详情
- 好用的视频播放器都有哪些呢?这几款软件就很不错
很多人都特别喜欢看视频,其实在无聊的时候选择一款比较好的视频播放器来观看视频也是很不错的,但是不同的播放器视频资源是不一样的,有些视频播放器还需要花钱,所以说这个时候很多人都想要找到一款比较好用的视频播放器。那么好用的视频播放器…查看详情
- 草图大师快捷键有哪些
sketchup平移快捷键?sketchup的平移快捷键是“H”。 这个快捷键可以帮助用户快速地进行平移操作,是使用sketchup时非常实用的技巧。 同时还有其他的快捷键,如移动和旋转,使用这些快捷键可以帮助用户更快速地完成建模任务。…查看详情
- 白云区营业执照在哪里办理
广州办理营业执照需要哪些材料? 1、申请人签署的《个体工商户设立登记申请书》; 2、申请人身份证明复印件(或户籍证明); 3、经营场所使用证明; 4、《字号名称预先核准通知书》。 5、申请登记的经营范围中有法律、行政法规和国务…查看详情
- ipad怎么连接电脑? ipad连接电脑方法
一直以来都跟大家分享各种手机品牌的投屏技巧,电脑的投屏技巧,但其中iPad的就极少分享。下面*就给大家啊来详细介绍一下ipad怎么连接电脑?ipad连接电脑方法这一块的内容,希望下面的内容能帮助到大家。ipad怎么连接电脑 第一步 …查看详情
- 2022免费自助建站空间有哪些?
对于初学者来说,想要搭建一个网站的话并不容易,不过也不用担心,因为现在有很多免费的自助建站空间,可以帮助到大家不仅在使用的时候,完全不用投入金钱,创建平台也是比较简单的,那么免费自助建站空间有哪些呢?一起来了解吧。1、OpenShift这个…查看详情
- 磁盘管理软件有哪些 磁盘管理软件哪个好
光盘相信大家都听说过,在很早以前这种东西是非常流行的,不管是听音乐还是看喜剧,只要有了光盘就可以看,虽然现在光盘在市面上已经很少了,但是,磁盘已经完全替代了这种,磁盘管理软件有什么? 1、DiskGenius 是一款磁盘分区…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的数字选用平台

400-0033-166
8:30-18:00















































注册有好礼



