服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

“数据科学”的演化及应用

2021-01-06 13:50:31 阅读(133 评论(0)

数据科学家如何变得性感的故事,大致就是统计学作为一门成熟学科如何与新兴学科的计算机科学发生关系的故事。“数据科学”这个术语出现较晚,用来指代一个需要解释大量数据的职业。但数据的解读历史悠久,多年来一直被科学家、统计学家、图书馆员、计算机科学家和其他人讨论。以下时间线可以追溯到“数据科学”一词的演变,以及它的应用、定义它的尝试和一些相关术语。1962年Johnw.Tukey在数据分析的未来(”TheFutureofDataAnalysis)写道:“长期以来,我以为自己是统计学家,对从特例中得到关于整体的推断感兴趣。但当我目睹了数学统计学的发展时,我产生了猜测和怀疑。。。我开始觉得我的基本兴趣在于数据分析。。。数据分析和一些相关的统计学必须承担更多的科学特征,而不是数学特征。。。数据分析本质上是一门经验科学。。。预设程序的电子计算机。。它有多重要?在许多情况下,答案令人惊讶:重要但不重要,计算机在其他情况下无疑是至关重要的。1947年,Tukey创造了“比特”(bit)“这个术语在1948年被Claudeshanonused用于“传播数学理论”(”AMathematicalTheoryofCommunications)一文中。Tukey于1977年出版了《探索性数据分析》(ExploratoryDataAnalysis),他在书中提出,我们应该更加关注使用数据来提出哪些假设需要测试的建议,以及探索性数据分析和论证性数据分析“能够并驾齐驱”。1974年,Peternaur在瑞典和美国出版了《计算机方法简要调查》(ConciseSurveyofComputerMethods)。这是一项关于当时使用的数据处理方法的调查,包括许多应用程序。本书遵循国际信息处理联合会的数据处理概念和术语指南(IFIPGuidetoConceptsandTermsinDataProcessing)“数据”的定义:“(数据是)必须能够以某种形式传播或操作事实或想法的标准化表现。根据这本书的前言,国际信息处理联合会于1968年展示了一份题为“数据学:数据处理的科学及其在教育中的地位”的课程计划。Naur为数据科学提供了以下定义:“数据形成后,处理数据的科学。数据与它所代表的东西之间的关系属于其他领域和科学范畴。1977年,国际统计联合会(TheInternationalAssociationforStatisticalComputing(IASC))作为国际统计研究院(ISI)成立了一个分支。“国际统计联合会的任务是将传统的统计方法、现代计算机技术与各领域专家的知识联系起来,将数据转化为信息和知识。“GregoryPiatetsky-Shapiro于1989年组织并主持了第一次数据库知识发现(KnowledgeDiscoveryinDatabases(KDD))研讨会。1995年成为国际计算机年会知识发现和数据挖掘的SIGKDD会议。1994年9月,《商业周刊》发表了一篇关于“数据库营销”的商业报道:“企业收集了大量关于你的信息,并将这些知识提炼成营销信息,准确地瞄准你。。。20世纪80年代扫描码器的繁荣在广泛的失望中结束:许多公司被总数据淹没,但无法获得有用的信息。。。然而,许多公司认为,他们别无选择,只能勇敢地站在数据库营销的前线。1996年国际分类协会联盟(InternationalFederationofClassificationSocieties(IFCS))双年会在日本神户举行。“数据科学”一词首次包含在会议标题中(“数据科学、分类等相关方法”)。联盟由六个国家/语言分类组织于1985年成立,其中一个是“分类协会”(TheClassificationSociety)成立于1964年。这些分类协会在其出版物中大量使用数据分析、数据挖掘、数据科学等术语。UsamaFayy1996年、GregoryPiatetsky-Shapiro、Padhraicsmyth出版了《从数据挖掘到数据库的知识发现》(FromDataMiningtoKnowledgeDiscoveryinDatabases”)。他们写道:“在过去,从数据中寻找有用的模式被赋予了许多名称,包括数据挖掘、知识提取、信息发现、信息收获、数据考古学和数据模式处理。KDD(数据库中的知识发现)是指从数据中获取有用知识的整个过程,而数据挖掘是指具体的环节之一。数据挖掘是利用特定算法从数据中提取的模式...KDD过程中的其他步骤,如数据准备、数据选择、数据清洗、与合适的已知识相结合、对挖掘结果的正确解读,对于确保从数据中获得有用的知识非常重要。数据挖掘方法的盲目应用(统计文献中被批评为“数据挖泥”(datadredging))可能是危险的,会得到无用的发现和无效的模式。”1997年C.F.密歇根大学统计系HeffWu教授(现在在乔治亚理工大学工作).C.在就职典礼上,Carver主席提出统计学应重命名为数据科学,统计学家应重命名为数据科学家。1997年《数据挖掘与知识发现》(DataMiningandKnowledgeDiscovery)期刊发行。这两个术语的顺序意味着“数据挖掘”地位的上升,并成为描述“从大数据库中提取信息”的一种更流行的方式。1999年12月,沃顿商学院Knowledge@Wharton的《从数据中挖掘知识的金块》引用了JacobZahavi的说法:“传统的统计方法在小数据集上工作得很好。但今天的数据库有数百万行和大量列……可扩展性已经成为数据挖掘的一个大问题。另一个技术挑战是开发一个模型,可以更好地分析数据,发现非线性关系和元素之间的联系……网站决策可能需要特殊的数据挖掘工具。WilliamS2001年.Cleveland出版了《数据科学:扩展统计技术领域的行动计划》(“DataScience:AnActionPlanforExpandingtheTechnicalAreasoftheFieldofStatistics”)。该计划“扩大统计领域技术工作的主要领域。雄心勃勃的计划包含了本质的变化。变化后的领域被称为“数据科学”。“Cleveland在计算机科学和当代数据挖掘工作中定位了这一新领域:“……数据分析师的收入有限。由于计算机科学家思考和分析数据的方法有限,统计学家对计算环境的知识有限。知识的融合将带来巨大的生产力创新。这意味着统计学家应该更加关注知识的计算,就像过去数据科学关注数学一样。数据科学系应该由致力于改进数据计算的成员和与计算机科学家合作的成员组成。2001年,LeoBreiman出版了《统计建模:两种文化》(“StatisticalModeling:TheTwoCultures”):在使用统计模型从数据中提取结论的过程中,有两种文化。假设数据是由特定的分布模型生成的。另一种是使用算法模型,并将数据结构视为未知。统计学界普遍致力于只使用数据模型。这种投资产生了毫无意义的理论和可疑的结论,使统计学家无法触及许多实际问题。在理论和实践中,算法模型在统计学之外发展迅速。它不仅可以应用于庞大而复杂的数据集,还可以在小数据集上建立大量准确信息的模型。如果我们的目标是使用数据来解决问题,那么我们需要摆脱对纯基于数据模型的依赖,并使用更多样化的工具。”

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

矿泉水品牌有哪些 矿泉水品牌排行榜

  随着中国经济社会的发展,人们生活水平的提高,人们消费的品牌意识越来越强。重视品牌,反映了消费者生活理念的转变。同质同价的矿泉水,消费者更青睐品牌产品。那么国内知名常见的饮用矿泉水中,到底哪个牌子的水质最好呢?下面万商云集小编就给大家来详…查看详情

视频剪辑软件哪个好?这5款超好用!

随着抖音、快手等短视频的普及和发展,拍摄视频成为了当代人日常生活娱乐重要的形式,而只会拍不会剪辑视频还不够,很多朋友也在向小万咨询视频剪辑软件哪个好用?小万推荐各位试用下这5款,从初学到专业级的剪辑软件都有。 第一款:PremierePre…查看详情

微信小程序怎么开的?三个步骤帮你搞定

微信小程序可以说是使用比较便捷,也是使用率比较高的一款工具,深受很多行业的商家以及顾客的喜爱,尤其是很多的商家能够开发出自己想要的微信小程序,能够带来很好的发展,但是也有些商家并不懂技术,在这种情况下就应该要学习微信小程序如何来…查看详情

怎么查询公司是不是中小企业?

  现在处于全民创业时代,不论是刚毕业的大学生还是已经工作已久的在职人员或者个体商贩,都有着自己当老板的想法。现在整个市场上也是有很多的中小企业的存在的,中小企业算是整个市场的主力军,下面小编就给大家来详细介绍一下怎么查询公司是不是中小企业…查看详情

推荐几款电脑优化软件,让电脑运行更流畅

相信有很多用户都遇到很大一个问题,电脑怎么莫名其妙就变卡了呢?开机时长越来越慢,加载网页时长越来越长等等。这是因为电脑里面垃圾信息文件等等太多了导致的原因,今天小编给大家推荐几款电脑优化软件,一起来看一下吧。 1.软媒魔方…查看详情

家用吹风机排行榜 公认最好的四款吹风机

吹风机所吹出来的吹发效果与风的温度,风嘴的形状还有吹风机的内部负离子功能有关。不同形状的风嘴利用于不同发质的头发。扩散的风嘴形状可以有利于吹出更好的蓬松头发的感觉。额,集中状态的封嘴有利于吹出更好的柔顺的头发。以下几款吹风机品牌…查看详情

网上卖房子怎么发布

  随着互联网的发展,网上买卖房屋已成为一个非常流行的趋势,在互联网上发布房产信息已经成为很多房主和经纪人的常规操作。而如何发布房屋信息以便快速被寻找,吸引更多的潜在买家,是一个非常重要的问题。下面将详细描述如何在网上卖房子。  1.选择合…查看详情

2021最新手机跑分测试软件排行榜

目前市场上的手机越来越多,很多人都想测试下手机能跑多少分,虽然跑分结果并不一定代表手机真实的性能度,但也从侧面反映出一款手机的优劣度。所以,小万整理出了市场上比较主流的8款手机跑分测试软件,供各位做一个参考。 第1名:鲁大师鲁大师不仅在PC…查看详情

浏览器内核版本过低怎么升级

浏览器内核版本过低可能导致页面显示问题、功能不兼容以及安全漏洞等问题。为了解决这些问题,您可以尝试以下方法来升级浏览器内核版本:1. 更新浏览器: - 首选方法是直接更新使用的浏览器软件。现代浏览器如Google Chrome、Mozi…查看详情

适合孩子的学习机有哪些 学习机排行榜十强

  都说教育从来都不是短跑,而是马拉松!而这场马拉松中最关键的就是家长的陪跑!可现实中家长往往因为种种原因无法保证高质量的陪伴,以前可以“偷懒”把孩子送各种课外辅导班进行学习,不过现在双减政策的实施,让这种方式直接受到了限制!下面小编就给大…查看详情

照片处理软件哪个好 修照片软件app哪个好

  最近有许多小伙伴都在咨询小编修照片软件app哪个好,下面小编就给大家介绍几款照片处理软件。、一、迅捷图片转换器  这是一款电脑端的图片处理工具,软件内包含了格式转换、图片压缩、抠图换背景、去水印、照片修复和拼图等多个实用功能,接下来就为…查看详情

手机通讯录管理软件 免费管理通讯录的软件

  作为iOS 系统内置的官方应用,通讯录一直以来都处于一个「不温不火」的状态,究其原因,一方面,对于绝大多数人而言,通讯录的使用场景主要还是「新增」和「查找」联系人;另一方面,有人认为它设计不够漂亮,功能还不够强大。  也许正是因为这样…查看详情

英汉互译软件哪个好 英汉互译软件排行榜前十名

现在生活中对于翻译的需求是越来越大了,英汉互译的软件需求也是越来越大了,下面万商云集小编给大家介绍下英汉互译软件哪个好 英汉互译软件排行榜前十名这方面的内容。  1.google翻译  谷歌翻译(google tra1late)可翻译64…查看详情

python基本命令大全

python如何查看库信息?Python中有多种方式可以查看库信息,以下列举几种常见的方法: 1.使用help函数:在Python交互环境中,我们可以使用help函数查看库的文档信息。例如,我们要查看numpy库的文档,可以输入以下命…查看详情

免费好用的预算管理软件有哪些 2022预算管理软件排行榜

  现在在很多的工程装修这个板块都会使用到预算这一块的软件,现在市面上的预算软件是非常的多的,下面小编就给大家来详细介绍一下免费好用的预算管理软件有哪些 2022预算管理软件排行榜这一块的相关内容,希望能帮助到大家。  2022预算管理…查看详情

最新文章