完整的互联网数据分析能力养成提纲
2020-12-31 11:19:00 阅读(158) 评论(0)
我会根据大纲增加互联网侧的内容,如网站分析、用户行为序列等。我不想留在表面上,而是系统地讲述。比如什么是产品埋点?获得埋点数据后,如何使用Python/Pandas?shift()函数将其清洗为用户行为session,然后计算用户在每个页面的停留时间,以及如何将其转换为统计宽表,以及如何建立用户标签。以下是每周的学习概述。第一周:Excel学习掌握如果Excel玩得顺滑,你可以跳过这一周。但是我入行的时候也不会vlookup,所以有必要说一下。重点是了解各种函数,包括但不限于sum,count,sumif,countif,find,if,left/right,时间转换等。Excel函数不需要完全学习,学习搜索很重要。也就是说,如何在搜索引擎上清楚地描述遇到的问题。我认为掌握vlookup和数据透视表是最划算的两种技能。学习vlokup,SQL中的join,Python中的merge很容易理解。学习数据透视表,SQL中的group,Python中的pivot_table也是如此。基本上,10万条以内的数据统计并不难,80%的办公室白领都可以秒杀。Excel熟能生巧,多找练习。还需要养成好习惯,不要合并单元格,不要太花哨。根据原始数据(sheet1)表格、加工数据(sheet2),图表(sheet3)的类型管理。以下是为以后更好的基础而附加的学习任务:了解单元格式,后期的数据类型包括各种timestamp,date,string,int,bigint,char,factor,float等。了解数组,以及如何使用(excel数组很难使用),Python和R也将涉及list。了解函数和参数,当先进的编程数据分析师时,会让你掌握得更快。了解中文编码、UTF8和ASCII,包括CSV的delimiter等,以后你会回来感谢我。本周的内容将分为函数和技能两部分。这是一个练习,我给你1000个身份证号码,告诉我有多少男女,各省市人口的分布,这些人的年龄和星座。若能完成上述过程,则本周直接跳过。第二周:数据可视化数据分析界有一句经典名言,字不如表,表不如图。数据可视化是数据分析的主要方向之一。除数据挖掘等高级分析外,许多数据分析都是监控数据观察数据。数据分析的最终结论是出售自己的观点和结论。最好的兜售方式就是给老板做一个有清晰观点和详细数据的PPT。如果没有人同意分析结果,那么分析就不会得到改进和优化。未落地的数据分析价值在哪里?首先要了解常用的图表:Excel图表可以100%完成上述图形要求,但这只是基础。编程绘制必然需要后续的高级可视化。为什么?例如,常见的多元分析,你能很容易地用Excel完成吗?但IPython只需要一行代码。第二,掌握BI,下图为微软BI。BI(商业智能)和图表的区别在于BI擅长交互和报告,更擅长解释已经发生和正在发生的数据。将要发生的数据是数据挖掘的方向。BI的优点是在很大程度上解放数据分析师的工作,提升全部门的数据意识,减少其他部门的数据需求(万恶导数据)。BI市场上有很多产品,基本上都是通过维度的联动和钻取,建立仪表盘Dashboard进行可视化分析。最后,我们需要学习制作可视化和信息图。这是安(装)身(逼)立(加)命(薪)的基础。这与数据能力无关,更注重审美、解读、PPT、信息化能力。但是花点时间学习是值得的。数据可视化学习有三个过程:理解数据(图表)集成数据(BI)展示数据(信息化)第三周:本周分析思维的训练很容易,学习理论知识。好的数据分析首先要有结构化的思维,俗称金字塔思维。思维导图是必不可少的工具。然后了解SMARTT、5W2H、SWOT、4P理论,六顶思维帽等框架。这些框架都是大巧不工的经典。分析也有框架和方法论,主要集中在三个关键点:一个业务没有指标,不能增长和分析;好的指标应该是比例或比例;好的分析应该是比较或相关的。举个例子:我告诉你今天一家超市有1000人的客流。你会怎么分析?与附近的其他超市相比,这1000人的数量是多是少?(对比)这1000人的数量比昨天多还是少?(对比)实际购买了多少1000人?(转化率)路过超市,超市外的人流是多少?(转换率)这是一种快速构建分析框架的方法。如果只看1000人,就看不到分析,也看不到任何结果。优秀的数据分析师会折磨别人的数据,他自己的分析经得起折磨,这就是分析思维能力。需要确切理解的是,数据思维不能在一周内锻炼,只能理解。数据思维是不断练习的结果,我只是尽量缩短这个过程。第四周:数据库学习Excel处理10万条以内的数据没有问题,但互联网行业并不缺乏数据。只要产品有一点规模,数据就是百万。此时需要学习数据库。在招聘条件下,越来越多的产品和运营岗位将SQL作为优先加分项。SQL是数据分析的核心技能之一,从Excel到SQL绝对是数据处理效率的一大进步。围绕Select学习。可以跳过增删、约束、索引和数据库范式。主要了解where,groupby,orderby,having,like,count,sum,min,max,distinct,if,join,leftjoin,limit,and和or的逻辑,时间转换函数等。如果你想进一步学习row_number,substr,convert,contact等。此外,不同数据平台的函数也会有所不同,比如Presto和phpmyAdmin。再追求一点,就去了解Explain优化,了解SQL的工作原理,了解数据类型,了解IO。以后可以和技术研发人员谈笑风生。毕竟用“这里有bug”的说话代替“这个数据死锁”,差别很大。SQL的学习主要是多练习,网上找相关练习,刷一遍差不多。第五周:学习统计知识很遗憾,统计知识也是我的弱点,但这是数据分析的基础。我读过很多与产品和运营相关的数据分析文章,没有提到太多的统计知识。这并不严格。比如产品的AB测试,如果产品经理不知道可信度的含义和概念,那么好的效果并不意味着真的好。特别是5%这种非显著的增加。例如,如果操作一个活动,如果操作不理解测试的相关概念,那么如何判断数据中的活动是否有效呢?更别说平均数了。我们来讨论一下经典的概率。如果一个人得了流感,实验结果是阳性的概率是90%;若无流感,实验结果为阳性的概率为9%。现在这个人的测试结果是阳性的,他有多少机会得流感?如果你认为有50%的机会,、60%、70%等等,然后都犯了直觉错误。它还与*的基本概率有关。统计知识将教我们从另一个角度看待数据。假如大家都知道统计数据会撒谎,那么就知道很多数据分析的决策并不可靠。我们需要一周的时间来掌握描述性统计数据,包括平均值、中位数、标准差、方差、概率、假设检验、显著性、整体和抽样。我们不需要学习更高层次的统计知识。谁让我们快速成功?只要你不被数据欺骗,就不要犯错误。以Excel分析工具库为例(在网上找到图片)。在初级统计学习中,我们需要理解列1的名词含义,而不是停留在平均值的基础上。第六周:本周需要了解业务知识(用户行为、产品、运营)。对数据分析师来说,对业务的理解比数据方法论更重要。当然,不幸的是,商业学习没有捷径。我举个数据沙龙的例子。一家O2O配送公司发现,在重庆,送货员的送货效率低于其他城市,导致用户好评率下降。总部的数据分析师建立了各种指标来分析原因,但没有发现问题。后来在采访中发现,由于重庆是山城,路面高低落差夸大,很多外卖人员的小电池上不了坡...因此,交货效率较慢。在这种情况下,我们只知道送货员的送货水平距离,即POI数据,不可能知道垂直距离的数据。这就是数据的局限性,也是只看数据的分析师和接地气分析师之间最大的区别。了解业务市场是数据分析在工作经验中最大的优势之一。不同行业的商业知识是不同的,所以我不会献丑。在互联网行业,需要了解几个广泛的业务数据。产品数据分析,通过经典的AAARR框架学习,了解活跃保留的指标和概念(我的历史文章已经涉及到这些内容的一部分)。而且数据分析师需要知道如何用SQL计算。因为在实际的分析过程中,保留只是一个指标,通过userid关联和拆分是常见的分析策略。网站数据分析可以抽象地吃一个哲学问题:用户从哪里来?(SEO/SEM),用户去哪里(访问路径),用户是谁(用户画像)/用户行为路径)。虽然网站不再是互联网的主流,但现在有很多应用程序 Web的复合框架,朋友圈的传播活动一定要用网页的指标来分析。用户数据分析是数据操作的应用。在产品的早期阶段,转换率可以通过埋点计算,AB测试可以实现快速迭代的目的。在用户数量积累的后期阶段,用埋点分析用户行为,建立用户分层用户肖像。例如,用贝叶斯算法计算用户的性别概率,用K聚类算法划分用户群,用行为数据建立响应模型。但是,快速入门不需要掌握这些,只需要有一个大致的框架概念。除商业知识外,商业层面的沟通也十分重要。当业务线足够长时,我不止一次遇到产品和运营都没有掌握所有的业务要点,特别是涉及跨部门的分析。良好的业务沟通能力是数据分析的基本能力。第七周:Python/R学习终于到了第七周,也是最痛苦的一周。此时,我们应该学习编程技巧。是否具备编程能力是初级数据分析和高级数据分析的风水岭。编程能力(如上面的多元散点图)用于数据挖掘、爬虫和可视化报表。掌握一门优秀的编程语言,可以让数据分析师事半功倍,升职加薪,嫁给白。以最流行的R语言和Python为学习支线,快速学习一个。我刚刚学过两种类型。R的优点是统计学家编写的,缺点也是统计学家编写的。如果是各种统计函数的调用、绘图和分析的前验性论证,R无疑有优势。然而,大数据量的处理是不可能的,学习曲线是陡峭的。Python是一种通用的胶水语言,具有很强的适用性,可以脚本化各种分析过程。Pandas,SKLearn等各包也已追平R。学习R需要了解数据结构(matrix,array,data.frame,list等))、数据读取,图形绘制(ggplot2)、数据操作,统计函数(mean,median,sd,var,scale等。).暂时不需要涉及高级统计,这是后续的学习任务。RStudio是R语言开发环境的建议。学习Python有很多分支,我们专注于数据分析。需要了解调用包、函数、数据类型(list,tuple,dict),条件判断、迭代等。在有精力的情况下,高级Numpy和Pandas涉及。Anaconda是Python开发环境的建议,可以避免环境变量、包装安装等大多数新手问题。Mac有自己的Python2.7,但是现在Python3已经比几年前成熟了,没有编码问题,不要抱成守旧。第七周对于没有技术基础的运营和产品来说是最困难的,尽管SQL+Excel足以处理入门级数据分析,但当涉及到循环迭代和多元化图表时,复杂性呈几何形状上升。更不用说数据挖掘这种高级玩法了。我也相信,未来了解数据挖掘的产品和运营将具有很强的竞争力。到这里,正好是七周。假如还需要第八周 ,它是整合和整合上述内容。毕竟,这只是一个目的性很强的速成,一个开始,而不是数据分析的毕业典礼。如果你想进一步提高数据分析能力,或者成为一名优秀的数据分析师,你可以继续学习和掌握每周的内容。事实上,仅仅两周的商业知识和统计知识是非常不稳定的。在以后的学习中,会有很多分支。比如偏策划的数据产品经理,偏统计的机器学习,偏商业的市场分析师,偏工程的大数据工程师。这是后话。
推荐阅读
- 财务分析软件有哪些 财务数据分析用什么软件好
随着中国软件行业不断推进,中小企业蓬勃发展,目前市场上财务报表分析软件公司也随之越来越多。财务报表用哪个软件做最高效?无论哪个行业多大规模的公司,财务都是不可或缺的岗位。可能在很多人的眼里,财务是一份比较琐碎甚至枯燥的工作,每天面对一大…查看详情
- php主要用于什么开发
php主要用来做什么?PHP脚本主要用于以下三个领域: 1、服务端脚本。这是PHP最传统,也是最主要的目标领域。开展这项工作需要具备以下三点:PHP解析器(CGI或者服务器模块)、web服务器和web浏览器。需要在运行web服务器时,安装并…查看详情
- 关于新店开业策划的方案和具体操作
随着时代的发展,社会的进步,现在越来越多的人选择自己开店经营。既然要开店,那么也要有新店开业策划,以保证新店开业能够顺利进行。新店开业策划也可以激发人气,从而做到大大提高销售额,下面是关于新店开业策划的方案和具体操作详解。 新店开业策划活动…查看详情
- 万商云集2020“客户升级年”——助力客户实现数字化升级
物不因不生,不革不成。走过2018的“客户价值年”,告别2019的“客户运营年”,万商云集重新审视研判中小企业内外部市场变化、洞察国内外宏观经济形势,将2020年定义为万商云集“客户升级年”。无论是“客户价值年”,还是“客户升级年”,其根本…查看详情
- 硅胶商标注册属于哪一类?
滴塑是什么东西?滴塑:又称为微量射出,是在针织棉布和各种化纤织物、纺织物的表面滴有白色或彩色的滴胶饰品,是一种PVC硅胶类似的产品,箱包、背包、服饰....上用的商标,大部分是这种类型。 加工比较复杂,我们常说的矽利康商标、矽利康滴塑标、…查看详情
- 可以免费看电视剧的网站有哪些?
现在市面上有很多的免费追剧软件,但是大多数还是要收费的,下面*就给大家来详细介绍一下可以免费看电视剧的网站有哪些这一块的相关内容,希望能帮助到大家! 可以免费看电视剧的网站有哪些 1.97韩剧网 这个和韩剧TV很相似,里面都是最新…查看详情
- 查水费明细的软件有哪些 查水费明细的软件排行榜
很多朋友都不知道自己家里的水表消费明细在哪查,而且很多人对这一块都不是很熟悉,下面*就给大家来详细介绍一下查水费明细的软件有哪些 查水费明细的软件排行榜这一块的相关内容,希望能帮助到大家。 查水费明细的软件排行榜 1、《支付宝》…查看详情
- 恶意抢注的要件是什么
在平时很多的小伙伴都不知道恶意抢注的要件的基本情况,而且对恶意抢注的要件都不是很熟悉,下面万商云集*就为大家整理了恶意抢注的要件这方面的相关内容,希望下面的内容能帮助到各位。 一、恶意抢注的要件是什么 所谓“恶意抢注”只是人们…查看详情
- 注册一个小公司需要多少费用
注册一个小公司需要多少费用主要取决于公司的种类、注册地点和业务范围等因素。一般来说,主要费用包括公司起名费用、注册费用、税费、相关证件申请费用等。 1. 公司起名费用:公司的名称是公司运营中的第一步,因此起一个好的名字是很有必要的。…查看详情
- 除了微信还有什么聊天软件靠谱-聊天交友软件靠谱又免费的
一看到聊天软件,我想大家的第一反应应该都是微信这个软件吧,毕竟自从腾讯公司开发了“微信”这款软件后就一直深受着大家的好评,也为我们的生活带来了很多方便快捷的事,解决了远在他乡却联系不到的问题。那么除了微信还有哪些靠谱的聊天软件呢?1.QQ腾…查看详情
- 佛山国税网上办税大厅办理流程
佛山场所码怎么领取?“场所码”申请流程 一、打开粤康码页面并下拉,点击公共场所→推荐给公共场所工作人员→“我是管理员”并填写信息进行场所创建: 二、复制场所申报码,返回上一页,点击我是检测员→输入场所申报码→查询绑定对应场所: …查看详情
- matlab哪个版本最好用
哪个版本的matlab比较好?matlab2020b,现阶段觉得挺好用。 MATLAB和Mathematica、Maple并称为三大数学软件。在数学类科技应用软件中在数值计算方面首屈一指。行矩阵运算、绘制函数和数据、实现算法、创建用户界面…查看详情
- 近十年好看的女频小说排行榜前三甲推荐
看小说,我们尽可能的选择一些比较火热的小说去看,如果不知道什么小说比较好看的话,可以先打听一下近十年好看小说排行榜都有什么从排行榜中选择,这样会容易一些,要不然的话,从所有的小说中选择的话是比较麻烦的。 1、《大佬宠妻不腻》…查看详情
- 2022年六大iphone备份软件
大家是否有过没有及时备份一些信息而消失的烦恼,这就是苹果手机的弊端,今天我就来给大家推荐几款2022年六大iphone备份软件,保证这些软件会是你所喜欢的软件,你肯定不会放弃他们,好好选择适合你的软件吧。 1.通讯录云备份…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
邮箱:zjb@iwanshang.com
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的AI增效平台

400-0033-166
8:30-18:00















































注册有好礼



