服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

“数据科学”的演化及应用

2021-01-06 13:50:31 阅读(163 评论(0)

数据科学家如何变得性感的故事,大致就是统计学作为一门成熟学科如何与新兴学科的计算机科学发生关系的故事。“数据科学”这个术语出现较晚,用来指代一个需要解释大量数据的职业。但数据的解读历史悠久,多年来一直被科学家、统计学家、图书馆员、计算机科学家和其他人讨论。以下时间线可以追溯到“数据科学”一词的演变,以及它的应用、定义它的尝试和一些相关术语。1962年Johnw.Tukey在数据分析的未来(”TheFutureofDataAnalysis)写道:“长期以来,我以为自己是统计学家,对从特例中得到关于整体的推断感兴趣。但当我目睹了数学统计学的发展时,我产生了猜测和怀疑。。。我开始觉得我的基本兴趣在于数据分析。。。数据分析和一些相关的统计学必须承担更多的科学特征,而不是数学特征。。。数据分析本质上是一门经验科学。。。预设程序的电子计算机。。它有多重要?在许多情况下,答案令人惊讶:重要但不重要,计算机在其他情况下无疑是至关重要的。1947年,Tukey创造了“比特”(bit)“这个术语在1948年被Claudeshanonused用于“传播数学理论”(”AMathematicalTheoryofCommunications)一文中。Tukey于1977年出版了《探索性数据分析》(ExploratoryDataAnalysis),他在书中提出,我们应该更加*使用数据来提出哪些假设需要测试的建议,以及探索性数据分析和论证性数据分析“能够并驾齐驱”。1974年,Peternaur在瑞典和美国出版了《计算机方法简要调查》(ConciseSurveyofComputerMethods)。这是一项关于当时使用的数据处理方法的调查,包括许多应用程序。本书遵循国际信息处理联合会的数据处理概念和术语指南(IFIPGuidetoConceptsandTermsinDataProcessing)“数据”的定义:“(数据是)必须能够以某种形式传播或操作事实或想法的标准化表现。根据这本书的前言,国际信息处理联合会于1968年展示了一份题为“数据学:数据处理的科学及其在教育中的地位”的课程计划。Naur为数据科学提供了以下定义:“数据形成后,处理数据的科学。数据与它所代表的东西之间的关系属于其他领域和科学范畴。1977年,国际统计联合会(TheInternationalAssociationforStatisticalComputing(IASC))作为国际统计研究院(ISI)成立了一个分支。“国际统计联合会的任务是将传统的统计方法、现代计算机技术与各领域专家的知识联系起来,将数据转化为信息和知识。“GregoryPiatetsky-Shapiro于1989年组织并主持了第一次数据库知识发现(KnowledgeDiscoveryinDatabases(KDD))研讨会。1995年成为国际计算机年会知识发现和数据挖掘的SIGKDD会议。1994年9月,《商业周刊》发表了一篇关于“数据库营销”的商业报道:“企业收集了大量关于你的信息,并将这些知识提炼成营销信息,准确地瞄准你。。。20世纪80年代扫描码器的繁荣在广泛的失望中结束:许多公司被总数据淹没,但无法获得有用的信息。。。然而,许多公司认为,他们别无选择,只能勇敢地站在数据库营销的前线。1996年国际分类协会联盟(InternationalFederationofClassificationSocieties(IFCS))双年会在日本神户举行。“数据科学”一词首次包含在会议标题中(“数据科学、分类等相关方法”)。联盟由六个国家/语言分类组织于1985年成立,其中一个是“分类协会”(TheClassificationSociety)成立于1964年。这些分类协会在其出版物中大量使用数据分析、数据挖掘、数据科学等术语。UsamaFayy1996年、GregoryPiatetsky-Shapiro、Padhraicsmyth出版了《从数据挖掘到数据库的知识发现》(FromDataMiningtoKnowledgeDiscoveryinDatabases”)。他们写道:“在过去,从数据中寻找有用的模式被赋予了许多名称,包括数据挖掘、知识提取、信息发现、信息收获、数据考古学和数据模式处理。KDD(数据库中的知识发现)是指从数据中获取有用知识的整个过程,而数据挖掘是指具体的环节之一。数据挖掘是利用特定算法从数据中提取的模式...KDD过程中的其他步骤,如数据准备、数据选择、数据清洗、与合适的已知识相结合、对挖掘结果的正确解读,对于确保从数据中获得有用的知识非常重要。数据挖掘方法的盲目应用(统计文献中被批评为“数据挖泥”(datadredging))可能是危险的,会得到无用的发现和无效的模式。”1997年C.F.密歇根大学统计系HeffWu教授(现在在乔治亚理工大学工作).C.在就职典礼上,Carver主席提出统计学应重命名为数据科学,统计学家应重命名为数据科学家。1997年《数据挖掘与知识发现》(DataMiningandKnowledgeDiscovery)期刊发行。这两个术语的顺序意味着“数据挖掘”地位的上升,并成为描述“从大数据库中提取信息”的一种更流行的方式。1999年12月,沃顿商学院Knowledge@Wharton的《从数据中挖掘知识的金块》引用了JacobZahavi的说法:“传统的统计方法在小数据集上工作得很好。但今天的数据库有数百万行和大量列……可扩展性已经成为数据挖掘的一个大问题。另一个技术挑战是开发一个模型,可以更好地分析数据,发现非线性关系和元素之间的联系……网站决策可能需要特殊的数据挖掘工具。WilliamS2001年.Cleveland出版了《数据科学:扩展统计技术领域的行动计划》(“DataScience:AnActionPlanforExpandingtheTechnicalAreasoftheFieldofStatistics”)。该计划“扩大统计领域技术工作的主要领域。雄心勃勃的计划包含了本质的变化。变化后的领域被称为“数据科学”。“Cleveland在计算机科学和当代数据挖掘工作中定位了这一新领域:“……数据分析师的收入有限。由于计算机科学家思考和分析数据的方法有限,统计学家对计算环境的知识有限。知识的融合将带来巨大的生产力创新。这意味着统计学家应该更加*知识的计算,就像过去数据科学*数学一样。数据科学系应该由致力于改进数据计算的成员和与计算机科学家合作的成员组成。2001年,LeoBreiman出版了《统计建模:两种文化》(“StatisticalModeling:TheTwoCultures”):在使用统计模型从数据中提取结论的过程中,有两种文化。假设数据是由特定的分布模型生成的。另一种是使用算法模型,并将数据结构视为未知。统计学界普遍致力于只使用数据模型。这种投资产生了毫无意义的理论和可疑的结论,使统计学家无法触及许多实际问题。在理论和实践中,算法模型在统计学之外发展迅速。它不仅可以应用于庞大而复杂的数据集,还可以在小数据集上建立大量准确信息的模型。如果我们的目标是使用数据来解决问题,那么我们需要摆脱对纯基于数据模型的依赖,并使用更多样化的工具。”

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

国内主流OA办公系统,哪款比较高端

目前,国内的oa办公系统越来越强大,并且办公秩序也井然有序,无异于办公系统的加持,尽管在不断的进步,但是也有许多用户商占一半,现在我们所观察到的发展,也在悄然声息的变化 1、泛微 这款产品我非常的推荐,他几乎是最具有代表性的…查看详情

按要求备好注册商标所需资料,才能提高商标注册成功率

说起商标,相信很多人都不会陌生,我们的周边也有很多商标的存在。商标做为知识产权时代的重要标志,也是企业布局的重要因素之一,但是随着时间的推移,商标作为种不可再生的资源,目前可以注册商标驳回量也是一年比一年高了。在进行商标注册时,我们一定要准…查看详情

自行车品牌有哪些 2022自行车品牌排行榜前十名

现在都在倡导健康绿色的生活方式,很多人把自行车作为了比较常规的出现方式,下面万商云集小编给大家来详细介绍一下自行车品牌有哪些 2022自行车品牌排行榜前十名有哪些,不知道下面的这些品牌大家使用过没有,。  1.捷安特  1972年成立于台湾…查看详情

数据恢复软件免费版,让丢失的数据轻松恢复

千辛万苦写好的方案,或者是修改了多次的照片,却因为错误的操作而丢失了,相信会让人非常的困扰,但目前使用的数据恢复软件多数都是要收费的,也增加了恢复数据的成本,那么下面为大家介绍数据恢复软件免费版,让数据恢复不再难。 1、傲…查看详情

万商云集服务大使,就差你一票了

2020年,是万商云集的“客户升级年”这一年,疫情袭来,我们看遍悲欢离合这一年,携手共进,一同见证百业复兴这一年,万商云集升级产品、做好运营带领一支出色的服务团队以专业的水平,至诚的态度真正用服务温暖寒冬这一年万商云集新增客户1.3万+全年…查看详情

什么是推广运营 运营推广是做什么的

现在很多的中小企业都不知道运营推广到底是干什么的,很多的企业其实想推广自己的产品,但是不知道怎么做,下面万商云集小编给大家来介绍下企业的运营推广这方面的常识。  但是想要运营好一个项目或者产品的前提是先让大众看到这个项目、产品的存在,了解它…查看详情

中文和英文域名注册规则,以及哪些名称不可用做或限制使用

网站的域名是为了解决人们对IP地址记忆不深的问题,几乎每一个知名的网站都有自己的域名。而要让自己的域名受到法律的保护,有侵权的情况也能够进行维权就要注册。那么,域名注册规则是怎样的呢?一起来了解一下吧。图片来源于网络 中文域名注册规则注册中…查看详情

糖果零售新品牌,玩转私域流量业绩增长368%

流量红利从平台公域流量向企业商家私域流量转变,不少企业商家借助小程序成功了建立起了自有流量池。厦门的一家糖果零售新品牌—苏小糖就是成功案例之一,通过私域流量建设,实现业绩增长368%。私域流量品牌建设1、产品包装苏小糖认为,包装不是成本,而…查看详情

末世小说排行榜,这几本十分好看

在民间流传着某些年是世界末日的传说,人们对于世界末日也有着一定的好奇心,甚至打败了恐惧的心理,所以各种世界末日的小说和影片也迎刃而生,那么关于一些好看的末世小说进行介绍,想看的话一定不要错过。 1、狩魔手记 这部小说在20…查看详情

校园车辆管理系统都有哪些优势?

车辆管理的尤其是很多的校园车辆比较多,如果想要进行更好的校园车辆管理,那么就应该要选择一款比较不错的管理系统,这样才能够带来更多的优势。选择了校园车辆管理之后能够实现信息的传送,而且还能够进行校园人员的考勤,管理相对来说是非常不…查看详情

服装、美妆、餐饮、果蔬活动推荐,引流、促销、获客三不误

炎热的夏天进入尾声,秋天到来,这时候服装、化妆品等行业都可以策划一场H5营销活动,来进行引流、促销、获客,甚至扩大品牌影响力。服装行业活动推荐活动主题:夏季服装清仓大促,全场5折起秋季服装新品发布,限时8折活动方式:限时折扣,新品促销,夏装…查看详情

今天推荐几款高效率的流程图制作软件

很多人为了能够展现出自己的工作事项,往往会使用流程图,而且很多品牌的宣传表上会使用到流程图,那么对于上班族来说,如何才能制作出美观的流程图呢?少不了用到以下的流程图制作软件。 1、亿图图示专家 亿图图示专家的研发基础是以绘…查看详情

面积测量软件有哪些 面积测量软件排行榜

  在很多的场合都会使用到测量软件这个东西,但是很多人都不知道测量面积用什么软件,下面小编就给大家来详细介绍一下面积测量软件有哪些 面积测量软件排行榜这一块的相关内容,希望能帮助到大家。  面积测量软件排行榜  1、《AR测量》  这是…查看详情

万商云集董事长王飞接受封面新闻、成都创客专访

近日,万商云集董事长王飞接受封面新闻、成都创客专访,讲述其创业初心和创业动力。王飞表示,万商云集主要解决中小企业在数字化转型中的产品选择难、落地应用难、售后服务难等问题,让中小企业“上云”更容易。“通俗地讲,SAAS就是共享软件+大数据+公…查看详情

图书管理系统哪个好,12款热门图书管理软件推荐

万商云集提供图书管理系统的在线咨询服务,在这里您可以了解到有关图书管理系统的功能介绍、常见问题以及购买流程,知名的图书管理软件有:美萍图书馆管理系统,汇文图书馆管理系统,广智图书管理系统,晴川图书管理系统等等。美萍图书馆管理系统美萍图书馆管…查看详情

最新文章