最新文章
- 数据分析入门基础:6种方法论和8种思路
数据分析方法论主要是从宏观角度介绍如何进行数据分析,它就像是一个数据分析的前期规划,搭建一个清晰的数据分析框架。那么对于具体的业务场景问题,就要靠具体的分析方法来支撑了,下面*就介绍几种常用的数据分析思路。
2020-12-28 - 数据分析该如何改变提数工程师的命运?
除了数据分析师之外,数据仓库和数据开发同学都会面临类似的困境,在很多分工不明确的公司中,这种提数需求是可以落在任意的数据同学身上,不同的是各个角色解决该问题的角度是不同的。简单来讲: 数据分析师:更多地要去深入到业务的需求中去,帮助产品、运营或者老板思考,通过更多的思考来帮助需求方设计更好的分析思路 数据仓库工程师:数仓同学的侧重点更多地在数据模型的设计,设计出更灵活的数据模型来支持多样性的分析提取需求 数据开发工程师:开发同学呢,则可以更多地侧重于工具的建设,比如OLAP系统的建设,自助分析工具的建设等等。
2020-12-28 - 数据科学的这5个坑,你踩过吗?
你参加了Kaggle的比赛,练习你的数据科学技术。你能搭建决策树和神经网络,很不错。但是说实话,你做的并不像一个真正的数据科学家。记住一个常用的法则,将80%的时间花在处理数据上,剩下的20%时间来搭建模型。 成为“Kaggle一代”在很多方面是有帮助的,数据通常是清洗的很好的,你可以花很多时间来调整你的模型。但是,在实际中,并不是这样,你需要自己从不同的地方收集数据,这些数据有不同的格式,不同的命名方式。
2020-12-28 - 五个措施减少可能渗透大数据集的“噪点”
如今,数据量越来越大。近年来,企业已经意识到数据分析可以带来的价值,并且已经开始采用。企业现在的设备几乎都在监测和测量,并创造了大量的数据,通常比企业处理的更快。其问题是,而正因为大数据定义为“大数据”,所以数据收集的小差异或错误可能会导致出现重大问题,错误信息和不准确的推论。 有了大量数据,就能够以业务为中心的方式来分析它的挑战,实现这一目标的唯一方法就是确保企业制定数据管理策略。
2020-12-28 - 如何开始数据分析?学习资源推荐
他表示,介绍进入数据科学领域所需技能的文章有很多,分享成功经验和意见的访谈也不少。但很少能找到文章具体介绍他们是如何开始自己的数据科学之旅的。所以,近期他在 Medium 上撰文分享了自己的成长经验。 他表示,刚开始的时候,自己也是个菜鸟,对很多知识并不是很擅长;并且,数学也从来不是自己最喜欢的科目。然而,今天他却很热爱这个领域。。。
2020-12-28 - 关于“数据驱动增长”,你了解多少?
“数据驱动增长”在2015年开始在国内被人提及,作为“Growth Hacking”的一部分,伴随Growth Hacking概念的流行而逐渐被互联网行业的产品、运营、数据分析人员所接受。 然而大多数朋友只是听说过“数据驱动增长”这个名词,对其方法还缺乏系统的认识。究其原因,首先是各公司普遍缺乏优秀的数据分析工具,其次是简短有效的课程或文章太少。作者本人通过在工作中的实践使用,总结了一些通用的方法、流程,虽不敢称完善,但足够让读者朋友从0做到“基本学会”。
2020-12-28 - 企业为什么重视数据分析与应用?
向我们这样的生产型企业通常用效率表、品质表、客户反馈表这三大表,来提高员工的生产率或准确率,表中员工是不变的,变化的是员工工作的方式,这种改变的作用是非常大的。一般从表面上看人力资源上的成本很高,但其实人力资源上的成本是最低的,如果企业能够运营好的话,由于员工的改变,企业得到的变化会最大。
2020-12-28 - 数据分析师最怕的数据错误!
数据错误的问题可能来自分析师主观的操作失误,也可能来自各种客观因素。比如,不同统计工具间的统计逻辑差异,业务方对同一个指标不同的定义和计算规则,用户和合作伙伴行为的复杂性和潜在的欺诈流量,原始数据太脏或缺失,复杂多变走位风骚的业务逻辑,以及需求方可能压根就不知道或者表达清楚自己到底想要什么?
2020-12-28 - 如何让你的数据会说话?汇报人要如何阐释?
一位听取过众多类似汇报的资深人士对我的表现大跌眼镜,他对我如是说,“当然看不懂,汤姆,他们不需要看懂,让他们明白数据的含义是你的工作。” 那是我在展示数据的第一个经验。一个数据分析汇报工作者面临一项艰难的任务,即让他人明白并相信数据的含义,并且要照顾到听众的专业背景,以易于听众理解的方式展示汇报数据。最好的方式就是将数据划分层次,并配上通俗易懂的解释说明。
2020-12-28 - 物流项目的基础数据分析
数据分析是一件很严肃和需要专业知识的工作,并非仅仅对数据进行简单的加减排列组合就可以了。我特别反对那些不注重数据分析的客户。一项设计,设计指标是基础。基础出现问题,你选用的设备再好,系统再先进,也是于事无补的。 其实物流仓储系统的规划设计也没有那么难,关键一点是需求要清楚明确。而需求是可以用数据来描述和定义的。一个项目,其关键数据也就那么几个而已,如收货量、发货量、库存量、拆零量、SKU等,并不难掌握。本文就讲一讲这些最基本的需求,为了便于理解,主要从物流仓储的几个环节进行描述。
2020-12-28 - 数据科学人才结构性短缺与填补方式
当你听到“数据科学家”这个头衔时,你会想到什么?可能不是一个衣衫褴褛、表情严肃的白领,对吧? 也许这就是为什么《哈佛商业评论》(Harvard Business Review)将“数据科学家”称为“21世纪最性感的工作”。他们写道,“如果‘性感’意味着拥有非常抢手的稀有品质,那么数据科学家已经在那里了。”他们很难招到,也很贵,而且由于他们的服务市场竞争非常激烈,很难留住他们。
2020-12-28 - 产品数据分析模型在实战中要注意的关键点
举例来说,当我们讨论销售额的时候讨论的是什么?这不是一句俏皮话,这是一个现实的问题。如果直接谈销售额我们很难有直观感受,但往往通过指标拆分后,我们拿到的结果告诉我们销售额其就是一个产品中支付界面的流程或者投放中产品触达的最优组合。 正是因为存在如此大的抽象层级差距,也就导致了在我们看到产品核心指标(注意一定要监控产品业务核心指标,而不是笼统的DAU等数据,如果对这个概念不太理解可以去我的主页看我本系列的第一篇文章)发生变化的时候,很难清楚到底是什么原因导致本指标的上升或下降呢?
2020-12-28 - 广告中的机器学习应用场景
在之前的规划里,这个系列应该从广告的起源,到涉及到技术架构,再到推荐系统的交叉结合对比,再到各个不同类型的广告业务场景,这么一个结构逻辑。所以,原定这个系列下一个内容,极有可能是涉及到游戏广告的垂直领域方面,也有计划去做这块的深入探索。 但是,从写完《推荐系统系列》之后,再到写到《数据与广告系列》第九篇,总感觉整个知识结构体系里缺了什么。直到最近才猛然想起来,是的,是算法维度的东西。
2020-12-28 - 业务数据异动,如何实现问题定位?
由于实时监控分析需要沉淀分析思路,同时需要灵活定制分析思路,所以会需要大量针对实时分析目标的个性化开发; 需要一个多维分析平台,有灵活的交互定制,作为实时数据多维分析的承载和交互实现工具。 通过节点颜色来警示问题点,阈值使用4周平均值的上下3个西格玛。 预警功能,母节点的字节点出现3个或以上超阈值情况,提示查看母节点可能出现异动。 支持手动添加时间轴事件,用于排查内外部事件对业务的影响。
2020-12-28 - 数据分析前的常规工作有哪些?
如果讲到数据分析前有哪些事是需要我们做的,那么有几个关键词:数据采集、特征提取、数据标准化、数据清洗和数据预处理,这些是常规数据分析前的工作。 那么再来看一下常规数据分析的流程,首先我们会有个需求,中间通过一些阶段,到达数据预处理。通常做数据分析的人员是从这一步开始,拿到数据开始预处理以及数据分析、建模、结果可视化或者是产品的输出。今天我想跟大家分享的是,中间通过的这些阶段,有了需求之后,到数据采集这个阶段,中间还需要利用数据分析方法做的事,包括数据采集中一部分量化的事情,也就是采集前,我们需要量化好后,才能做采集。
2020-12-28 - 用人单位较为看重的数据分析能力是什么?
仔细梳理,你会发现即便不是数据分析师,具备这4项能力都能在职场中为自己加分。 试想一下,一场电商大促结束复盘,别人花大把时间梳理数据,而你有更多精力分析定位问题,还能做出更好看的交互图表。业务分析,你拉大量的数据,手动打标签做图表,都不如几行Python代码来的高效。 我们来一条条解析。
2020-12-28 - 盘点:数据分析常用的术语解释
今天我们来盘点一下数据分析常用的术语解释。建议大家收藏起来方便查看。按照以下三类进行汇总。1、互联网常用名词解释2、统计学名词解释3、数据分析名词解释。PV(Page View)页面浏览量 指某段时间内访问网站或某一页面的用户的总数量,通常用来衡量一篇文章或一次活动带来的流量效果,也是评价网站日常流量数据的重要指标。PV可重复累计,以用户访问网站作为统计依据,用户每刷新一次即重新计算一次。
2020-12-28 - 数据分析岗位可很宽泛杂乱,该如何学习?
这个一个比较大的命题,很难一两句话弄说的清楚,所以这个的问题很在QQ群里不太能得到一个满意的答案。 在这里,我就以一个这数据方面的从业者的身份来说一说我的学习方法,当然有一点要说的是每个人的思想、方法、工作经历、知识侧重点都是不一样的,所以对于如何学习这个问题可谓是仁者见仁智者见智。我这里只说一说我个人的方法,不一定是对的也不一定适用于每一个人。
2020-12-28 - 正确的使用数据,“正确”到底是什么意思?
我不会说这些课程不好,我在大学里教了很多年的机器学习,这些课程总是聚焦于几个特定的算法。你学习了支持向量机,高斯混合模型,k-means聚类,等等,但你在做研究所论文的时候,你学过如何正确的使用数据吗? 所以,“正确”到底是什么意思?不是用结果来评价方法么?不是只要我预测准确率高就完事了吗?这当然是对的,但是关键是,确保你是真的在特征数据上取得了很好的性能。就像我在别处写的一样,,当你看到训练数据上的结果的时候,很容易就会让自己上当,认为自己的方法很有效。
2020-12-28 - 知识图谱构建人物关系:节点信息和边界信息
时下大热的《长安十二时辰》剧中”大案牍术”、”靖安司”频频出现,数据行业就有不少同学把大案牍术和当下最火热的“大数据”、“数据智能”联系起来,把 “靖安司”与“数据中台”相对比,笔者认为有点牵强附会。本文尝试结合自然语言处理(NLP)与图谱(Graph) 相关技术分析小说原文的人物图谱关系。
2020-12-28 - 如何预测未知性别?
对于所有广告平台来说,显性的增加可靠性别覆盖的方式,一方面是尽量的创建一些合理的业务场景来确保拿到最准确的身份证信息,比如防个沉迷啊,你总的证明你自己成年了,要做个信用评估啊,总的有官方认可的真实身份吧,等等之类。 除此之外,合法的第三方数据来源,这个就不深入展开说了。但不管怎么样,还是那句话,除了银行,都得解决这个问题。那么,就必然会面临如何预测未知性别的问题。
2020-12-28 - 深入分析:喜马拉雅的音频内容
每个行业的发展都有其背后的驱动力,在线音频市场的催生可以和在线视频、知识付费相联系。 相较于在线视频,在线音频被认为具有场景限制少、信息属性强、制作成本较低、情感氛围强等优点。 关于知识付费浪潮的掀起,有一个普遍认同的发展动力是阶层焦虑,即用户希望通过付费,筛选出优质的学习内容缓解社会进步带来的焦虑感,获得阶层认可、社交资源以及新知识。 此外,自媒体行业的兴起、技术层面的发展、产业分工的细致化等因素也同步促进了知识付费的发展。 付费化的在线音频与视频课程、问答打赏、付费工具共同构成知识付费产业。
2020-12-28 - 数据分析的工作权重和分析重点
初创期的重点在于验证产品的核心价值,或者说验证产品的假设:通过某种产品或服务可以为特定的人群解决某个问题。这个阶段应当遵循MVP(Minimum Variable Product) 的思想,以最小的成本来验证创业的想法,并根据用户的反馈快速迭代以调整解决方案,最终在数据上得到验证。
2020-12-28 - 分析案例丨朝阳医院在2018年里的销售情况
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 本篇文章中,假设以朝阳医院2018年销售数据为例,目的是了解朝阳医院在2018年里的销售情况,这就需要知道几个业务指标,例如:月均消费次数,月均消费金额、客单价以及消费趋势。
2020-12-28 - 数据科学家和数据分析师的角色有何不同?
数据科学家和数据分析师之间的区别是什么?这些角色的定义可能有所不同,但通常认为数据科学家结合了三个关键学科的知识——数据分析、统计、机器学习。机器学习涉及到数据分析的过程,以学习和生成分析模型,这些模型可以对看不见的数据执行智能操作,并且人为干预最少。有了这样的期望,很明显具有这三方面技能的数据科学家也越来越受到企业的青睐。 但是,数据科学家在这三个方面的表现都是完美的吗?更重要的是,所有这些角色都需要类似的技能吗?或者说数据分析师和机器学习工程师使用的技能和方法是完全不同的吗?
2020-12-28 - 模型上线该如何评估以及选择最终的预测结果?
文本特征跟常规的数值型特征不同,数值型特征是一种非常标准的模型输入格式,而类别类型的特征也只需要做字典编码之后,也可以转换为有限个数的类别,唯有文本类的特征,都是一段话一段话组成,无法直接使用。 但我们直观的可以看到,text和description两个字段,理论上应该相对是比较有区分度的,特别是在我们试过了N个算法accuracy不过5.2之后,剩下的这两个特征不行也得行了。 针对于文本特征,常见的处理手段是进行分词,不管是中文还是英文文本这个逻辑都是一致的,把词拆分之后,你会发现一个文本特征是由N个词组成的,而一个文本特征则意味着拥有N个词label,即我们可以模仿常规的label编码方式进行特征进一步处理了。
2020-12-28 - 数据科学工程师容易犯的10个错误
数据科学家是“比任何软件工程师都更擅长统计,比任何统计学家都更擅长软件工程的人”。许多数据科学家具有统计学背景,对软件工程几乎没有经验。我是一名高级数据科学家,在Stackoverflow的python编程上排名前1%,与许多(初级)数据科学家一起工作。以下是我经常看到的10个常见错误。
2020-12-28 - 什么样的数据分析师属于业内顶尖?
顶级的数据分析师一定会在数据变现最牛逼的行业里存在,比如金融风控或者数字广告行业,这些业务是真正的数据驱动,因为数据上差一点点,效益就会差一大截。 这里以运营商推出的“基于信用分的欠费免停机服务”为例来说明顶级数据分析师(为了描述方便,称其为A君)应该发挥出的价值,然后笔者总结了9个核心能力。
2020-12-28 - 数据分析常见的4种关键方法
当刚涉足数据挖掘分析领域的分析师被问及,数据挖掘分析人员最重要的能力是什么时,他们给出了五花八门的答案。 其实我想告诉他们的是,数据挖掘分析领域最重要的能力是:能够将数据转化为非专业人士也能够清楚理解的有意义的见解。 使用一些工具来帮助大家更好的理解数据分析在挖掘数据价值方面的重要性,是十分有必要的。其中的一个工具,叫做四维分析法。 简单地来说,分析可被划分为4种关键方法。
2020-12-28 - 一个好的数据分析师的判断标准是什么?
对于我们这些从事这一行业的人来说,我们总是发现科学家严重短缺。事情在变好之前,往往会变得更坏,因为对机器学习,AI和深度学习的需求正处在一个上升的趋势。结果就是,我们发现很多人冲着高薪,从其他职业转型。这样的结果很明显,雇主们面临的问题是:并不能为你的空缺职位找到好的候选人。
2020-12-28 - 如何有效利用海量数据,抓住背后的商业价值?
对于当今的企业来说,他们可以从各种各样的渠道中搜集海量数据,从播客到交易数据,物联网以及其中的所有渠道,我相信今天这个时代,不会再有哪个公司说他们面临数据问题。 但是,我认为很多公司,无论他们愿不愿意承认,都有着数据价值的问题,也就是说,他们不太能从搜集的数据或者所有的数据中获取真正的商业价值。
2020-12-28 - 如何对聚类分析做可视化?
当数据没有标签或者有少量标签的时候,我们需要使用聚类分析来发现数据的模式。便于理解聚类分析的结果或者效果,如何对聚类分析做可视化呢?不管是层次聚类还是划分聚类,都要寻找一个距离度量。然后根据计算后的距离,采用不同的策略进行数据集的汇聚。
2020-12-28 - 如何让数据分析充分为业务赋能?
我们都知道数据分析最基本的作用是发现问题,而解决问题就不是简单依靠数据就能够完成的,一般来说用数据分析解决问题的流程是这样的:数据分析–发现问题–结合业务分析原因–返回数据验证–发现新问题–循环往复–解决问题。 数据分析闭环的完成是需要结合业务才能实现的,任何抛开业务需求谈数据分析的,都是空谈!因此,为了避免出现数据分析沦为空谈主义,就必须要充分理解业务,针对业务场景进行数据分析,这样的结果才有价值。
2020-12-28 - 在线教育:如何留存,保持增长的密钥是什么?
2020年突如其来的新冠疫情,使得学生们“足不出户”,同时教育部宣布延期开学,教育局发出“停课不停学”的倡导,一时间教育行业超量活跃,众多新玩家入局,老玩家捐钱捐课,传统教育也纷纷转型线上。 当教育行业面临挑战和机遇同时到来时,在线教育企业如何在疫情之下抓住机会快速突围呢?
2020-12-28 - 阿里双11的基本规律是什么?
按惯例每年双11前我都会发文章预测当年双11的交易额,不知不觉间,今年已经是第六次来预测阿里双11的交易额了。双11是一个复杂的销售过程,每年的双11促销无异于一道奥数题,虽然各种促销让你眼花缭乱,但基本的规律还是在的。 但凡预测,一般来说需要建立一个复杂的预测模型,把各种影响因素都进行量化,然后得出一个看起来让人信服的“数字”。其实商业预测和学术研究的预测区别还是很大的,学术研究讲究严谨,商业预测讲究存在就合理,看似复杂的商业场景如果内在规律没有大变化的时候我们完全可以用简单的回归模型进行预测。
2020-12-28 - 堵漏数据科学面试中常见的4个失败点
“数据科学家”很可能是本世纪最性感的工作。但雇佣一个人绝不是这样。事实上,这对公司来说是非常痛苦的。对于有志于在核心数据科学领域获得那份完美工作的人来说,这同样是一件大事。 虽然机器学习很困难,但训练一个能让机器学习的人可能更困难。一个人通过各种专业知识的增量阶段发展成为一个高效的数据科学家。 对于试图找出其中一个的公司来说,这就像是大海捞针。在Gramener雇用数据科学家多年之后,我发现市场上出现了一些明显的重复出现的技能缺口模式。虽然失败的面试方式有上百种,但都可以分为4种。
2020-12-28 - 一个有挑战性的BI建设方案,如何来破局?
企业要规划一个BI项目,但是不知道从哪里下手,感觉需求太多,各个部门都有这种分析的诉求,多而杂,我们的信息化部门感觉在规划一个完整的BI建设方案的时候就很有挑战性。如何来破局?可以从以下这几个角度,结合企业的实际情况来思考。
2020-12-28 - 数据分析:红包是应该先抢,还是后抢?
网上有人分析微信红包用的方法是两倍均值法,意思即:每个人抢的额度为0.01到总额度除以剩余人数的两倍。本文用此方法来判断, 假定有10个红包共100元,此时均值为10,第一个人(设定为P1)抢到的值为0.01-20元内任意值。设P1抢到12元; 此时还剩下9个红包共88元,此时均值为9.77,第二个人P2抢到的值为0.01-19.55元内任意值。设P2抢到3元; 此时还剩下8个红包共85元,此时均值为10.625,第三个人P3抢到的值为0.01-21.25元内任意值。 依次计算下去,到第9个人抢完后,剩下钱的全是最后一个人的。
2020-12-28 - 数据分析当代“加班狗”的现状
中国加班有多疯狂? 今年3月,国家统计局数据显示,全国企业人员周平均工作时间为46小时,早已超过我国《劳动法》规定每周40小时的标准工时①。2020年,20至34岁的青年上班族,将占据全球职场的1/3,成为职场中坚力量②。 在此,我们选取了北上广深多个区域的85后上班族为对象,看看当代青年的加班情况如何。
2020-12-28 - 分析丨数据分析里的四大门派
所谓人多势众,以力取胜 想必数据分析行业里最常见的就是做取数的了,尤其是当数据分析火了之后,因为入行门槛比较低,也就造成了像丐帮一样的“三百六十行、鱼龙混杂”,而且工作相对不累,导致大量人士涌入,但实际岗位其实没那么多 但事实上,很多人都是被HR“骗”到公司来做取数机器的,很多公司名义上打着数据分析的额旗号,但实际招来的人就是做取数的。
2020-12-28 - 如何让数据更高效,让图表更直观?
《让图表开口说话》系列文章将会通过连载的形式为大家揭晓如何构建数据分析思路,如何结合实际场景剖析各种可视化图表的优缺点,真正实现“让数据更高效、让图表更直观”。 找到适合自己的东西是一件非常幸福的事情,比如一双合脚的鞋子,一杯甜度适宜的咖啡……如何在大而繁杂的数据中挖掘出有价值的信息,并通过直观的图表进行展示,想必是每位数据分析师都想要做的事情吧?
2020-12-28 - 如何通过学习数据分析来改变自己的职业道路?
除了家人朋友,很多时候,同公司内部的人也会比较困惑,数据分析师究竟是做什么的。收集数据、整理数据表、做各种报表、写 ppt、做挖掘模型、打小报告……每个人的理解都不一样。 “小陈,你能给我发一个去年一年的xx页面的访问量吗?最好是以国家,行业,公司规模作为纬度的,浏览量和 UV 都要。”在数据分析师眼中,这样的场景早已司空见惯。 由于我们对 SQL 等数据工具轻车熟路,很多部门就会直接找我们要数据,但并不会说清楚前因后果。这样不仅浪费分析师时间,也并不能解决业务人员的需求。
2020-12-28 - Gartner发布的2020年十大数据和分析趋势
到2024年底,75%的企业机构将从人工智能(AI)试点转为AI运营,基于流数据的分析基础架构的数量将因此增加5倍。 新冠疫情期间,机器学习(ML)、优化和自然语言处理(NLP)等AI技术正就病毒传播、应对效果及影响提供重要洞察和预测。 而强化学习和分布式学习等其他更智能的AI技术正在创建更具适应性和灵活性的系统,用于处理复杂的业务情况。例如,基于代理的系统可对复杂系统进行建模和仿真。
2020-12-28 - 如何应用最新数据积分榜,查询历史榜单?
中国队击败当时号称“东洋魔女“的日本女排,首次夺得世界冠军,这也是中国在三大球运动(足球、篮球、排球)中的首个世界冠军。 可以看到中国队依靠本次世界杯冠军的100积分,重新登上积分榜榜首。 但是国际排联只给出了最新这版的积分榜,如何查询历史榜单呢? 尝试更改一下URL后面的时间,发现可以成功获取√ 我们可以利用requests和正则来匹配并获取某年榜单的所有国家和积分。
2020-12-28 - 如何培养逻辑思维?4个要点需掌握
逻辑思维的过程,是化繁为简。它的目的,是找到问题的解决方法。因此,所有和“寻求解决方法”无关的信息,都是无用信息,都需要剔除。我很喜欢《教父》这部电影,里面有一句话让我记忆至今:花半秒钟就看透事物本质的人,和花一辈子都看不清事物本质的人,注定是截然不同的命运。举个例子,我在工作中经常会给高层领导做汇报PPT。这种PPT通常需要控制在10-15页以内,因为越高层的人,时间越宝贵,就越需要尽快了解和抓住事物的本质与关键。底下的人动不动写上十百来页的PPT,没有一个领导愿意看,反而会觉得你工作能力差,废话连篇。
2020-12-28 - 什么是指标?应从哪个角度去看数据指标?
指标表就是在同一个业务分析主题下的指标的组合,比如像财务分析-利润分析中的营业利润、利润总额、净利润、净利润率等,比如像采购分析-采购到货分析中的订单金额、实际到货金额、逾期到货金额、到货金额比率、逾期到货金额比率等等。通常情况下,他们都具有相同的分析维度。
2020-12-28 - 网易严选商品评论的获取和分析
当我们在搜索框中输入关键字进行搜索的时候,同样能够发现在 Network 中有很多请求。 此时可以观察各个请求,通过请求文件的名称(此处需要一些经验,守规矩的程序员都不会乱起名字),我们可以定位到搜索时展示搜索结果的请求。 搜索一般都是 search,所以我们就锁定了这个 search.json 的请求。同样把请求 URL 拷贝到 Postman 中,逐个验证传参,最后保留 page 和 keyword 两个参数即可。 该请求返回的数据较多,还是需要耐心的分析数据,也能够发现,在 result->data->directly->searcherResult->result 下面的 id 值,即为我们要获取的产品 ID。
2020-12-28 - 分割数据的方法越多,就越容易滋生确认偏差!
企业正在大量雇佣数据科学家,以做出严格、科学、公正、数据驱动的决策。 现在,坏消息来了:这些决定通常不是。 要想做出数据驱动的决策,就必须是数据(而不是其他东西)驱动它。看起来很简单,但在实践中却很少见,因为决策者缺乏关键的心理习惯。 数据驱动不存在了 想象一下,你正在考虑在网上买东西,而不是跑很远去店里买东西。你把你的决定归结为你是否信任网上的卖家。进行快速的搜索会得到一些相关的数据:你会看到卖家的平均评分是4.2,总分是5分。 如果没有决策基础,你的决策最多只会受到数据的启发,而不是数据的驱动
2020-12-28 - 详解丨思维模型、分析模型及指标体系
数据可以分为定性数据和定量数据。 定性数据是用来描述事物的属性,名称等,它一种标志,没有序次关系。例如,“性别”,“男”编码为1,“女”编码为2。 定量数据描述量化属性,或用于编码。如交易金额、额度、商品数量、积分数、客户评分等都属于量化属性。 定量数据可以继续划分:定序数据、定距数据与定比数据。 定序数据(Ordinal):数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。例如,“受教育程度”,文盲半文盲=1,小学=2,初中=3,高中=4,大学=5,硕士研究生=6,博士及其以上=7。 定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。例如,温度。 定比变量(Ratio):数据的最高级,既有测量单位,也有绝对零点,例如职工人数,身高。
2020-12-28 - 快消零售AI项目落地,要经历什么过程?
根据BCG(波士顿咨询公司)调研了全球数十家头部快消企业发现一个结论:这些企业已经在多个方向进行了AI的探索与尝试,并且也逐步取得了一些成果。绝大部分企业均认为需求预测、营销投放ROI分析、数据驱动的销售计划,个性化店货匹配等场景能带来最明显的业绩增长机会,是必须进行探索和尝试的。
2020-12-28 - 学习数据科学,应该从哪里开始?
你是否对学习数据科学感兴趣,但不知道从哪里开始?如果是,那你来对地方了。 我遇到过许多对学习数据科学充满热情的人,但仅仅几周后,他们就放弃了学习。我想知道为什么一个人对一个领域如此热情却不去追求它?通过与他们中的一些人交谈,我了解到人们放弃学习的主要原因是: 为了成为一名数据科学家,他们要学习的课题太多了 他们遇到的领路人说,要成为数据科学家,必须是一个有才华的程序员、数学专家、应用统计学大师,并且非常熟练地使用panda、NumPy和其他python库。
2020-12-28











































注册有好礼



川公网安备 51010402000322号

快速找产品






400-0033-166
8:30-18:00



