“数据科学”的演化及应用
2021-01-06 13:50:31 阅读(162) 评论(0)
数据科学家如何变得性感的故事,大致就是统计学作为一门成熟学科如何与新兴学科的计算机科学发生关系的故事。“数据科学”这个术语出现较晚,用来指代一个需要解释大量数据的职业。但数据的解读历史悠久,多年来一直被科学家、统计学家、图书馆员、计算机科学家和其他人讨论。以下时间线可以追溯到“数据科学”一词的演变,以及它的应用、定义它的尝试和一些相关术语。1962年Johnw.Tukey在数据分析的未来(”TheFutureofDataAnalysis)写道:“长期以来,我以为自己是统计学家,对从特例中得到关于整体的推断感兴趣。但当我目睹了数学统计学的发展时,我产生了猜测和怀疑。。。我开始觉得我的基本兴趣在于数据分析。。。数据分析和一些相关的统计学必须承担更多的科学特征,而不是数学特征。。。数据分析本质上是一门经验科学。。。预设程序的电子计算机。。它有多重要?在许多情况下,答案令人惊讶:重要但不重要,计算机在其他情况下无疑是至关重要的。1947年,Tukey创造了“比特”(bit)“这个术语在1948年被Claudeshanonused用于“传播数学理论”(”AMathematicalTheoryofCommunications)一文中。Tukey于1977年出版了《探索性数据分析》(ExploratoryDataAnalysis),他在书中提出,我们应该更加关注使用数据来提出哪些假设需要测试的建议,以及探索性数据分析和论证性数据分析“能够并驾齐驱”。1974年,Peternaur在瑞典和美国出版了《计算机方法简要调查》(ConciseSurveyofComputerMethods)。这是一项关于当时使用的数据处理方法的调查,包括许多应用程序。本书遵循国际信息处理联合会的数据处理概念和术语指南(IFIPGuidetoConceptsandTermsinDataProcessing)“数据”的定义:“(数据是)必须能够以某种形式传播或操作事实或想法的标准化表现。根据这本书的前言,国际信息处理联合会于1968年展示了一份题为“数据学:数据处理的科学及其在教育中的地位”的课程计划。Naur为数据科学提供了以下定义:“数据形成后,处理数据的科学。数据与它所代表的东西之间的关系属于其他领域和科学范畴。1977年,国际统计联合会(TheInternationalAssociationforStatisticalComputing(IASC))作为国际统计研究院(ISI)成立了一个分支。“国际统计联合会的任务是将传统的统计方法、现代计算机技术与各领域专家的知识联系起来,将数据转化为信息和知识。“GregoryPiatetsky-Shapiro于1989年组织并主持了第一次数据库知识发现(KnowledgeDiscoveryinDatabases(KDD))研讨会。1995年成为国际计算机年会知识发现和数据挖掘的SIGKDD会议。1994年9月,《商业周刊》发表了一篇关于“数据库营销”的商业报道:“企业收集了大量关于你的信息,并将这些知识提炼成营销信息,准确地瞄准你。。。20世纪80年代扫描码器的繁荣在广泛的失望中结束:许多公司被总数据淹没,但无法获得有用的信息。。。然而,许多公司认为,他们别无选择,只能勇敢地站在数据库营销的前线。1996年国际分类协会联盟(InternationalFederationofClassificationSocieties(IFCS))双年会在日本神户举行。“数据科学”一词首次包含在会议标题中(“数据科学、分类等相关方法”)。联盟由六个国家/语言分类组织于1985年成立,其中一个是“分类协会”(TheClassificationSociety)成立于1964年。这些分类协会在其出版物中大量使用数据分析、数据挖掘、数据科学等术语。UsamaFayy1996年、GregoryPiatetsky-Shapiro、Padhraicsmyth出版了《从数据挖掘到数据库的知识发现》(FromDataMiningtoKnowledgeDiscoveryinDatabases”)。他们写道:“在过去,从数据中寻找有用的模式被赋予了许多名称,包括数据挖掘、知识提取、信息发现、信息收获、数据考古学和数据模式处理。KDD(数据库中的知识发现)是指从数据中获取有用知识的整个过程,而数据挖掘是指具体的环节之一。数据挖掘是利用特定算法从数据中提取的模式...KDD过程中的其他步骤,如数据准备、数据选择、数据清洗、与合适的已知识相结合、对挖掘结果的正确解读,对于确保从数据中获得有用的知识非常重要。数据挖掘方法的盲目应用(统计文献中被批评为“数据挖泥”(datadredging))可能是危险的,会得到无用的发现和无效的模式。”1997年C.F.密歇根大学统计系HeffWu教授(现在在乔治亚理工大学工作).C.在就职典礼上,Carver主席提出统计学应重命名为数据科学,统计学家应重命名为数据科学家。1997年《数据挖掘与知识发现》(DataMiningandKnowledgeDiscovery)期刊发行。这两个术语的顺序意味着“数据挖掘”地位的上升,并成为描述“从大数据库中提取信息”的一种更流行的方式。1999年12月,沃顿商学院Knowledge@Wharton的《从数据中挖掘知识的金块》引用了JacobZahavi的说法:“传统的统计方法在小数据集上工作得很好。但今天的数据库有数百万行和大量列……可扩展性已经成为数据挖掘的一个大问题。另一个技术挑战是开发一个模型,可以更好地分析数据,发现非线性关系和元素之间的联系……网站决策可能需要特殊的数据挖掘工具。WilliamS2001年.Cleveland出版了《数据科学:扩展统计技术领域的行动计划》(“DataScience:AnActionPlanforExpandingtheTechnicalAreasoftheFieldofStatistics”)。该计划“扩大统计领域技术工作的主要领域。雄心勃勃的计划包含了本质的变化。变化后的领域被称为“数据科学”。“Cleveland在计算机科学和当代数据挖掘工作中定位了这一新领域:“……数据分析师的收入有限。由于计算机科学家思考和分析数据的方法有限,统计学家对计算环境的知识有限。知识的融合将带来巨大的生产力创新。这意味着统计学家应该更加关注知识的计算,就像过去数据科学关注数学一样。数据科学系应该由致力于改进数据计算的成员和与计算机科学家合作的成员组成。2001年,LeoBreiman出版了《统计建模:两种文化》(“StatisticalModeling:TheTwoCultures”):在使用统计模型从数据中提取结论的过程中,有两种文化。假设数据是由特定的分布模型生成的。另一种是使用算法模型,并将数据结构视为未知。统计学界普遍致力于只使用数据模型。这种投资产生了毫无意义的理论和可疑的结论,使统计学家无法触及许多实际问题。在理论和实践中,算法模型在统计学之外发展迅速。它不仅可以应用于庞大而复杂的数据集,还可以在小数据集上建立大量准确信息的模型。如果我们的目标是使用数据来解决问题,那么我们需要摆脱对纯基于数据模型的依赖,并使用更多样化的工具。”
推荐阅读
- 不同于微商城,小程序商城运营推广有诀窍
微商城和小程序是当前企业商家的主要流量来源,虽然两者都是基于微信的商城运营,但在运营推广上还是有区别的,企业商家切记不能一概而论。 流量入口的区别微商城需要和公众号绑定,可以通过二维码、转发链接进入,但总的来说还是需要依附在公众号上,将公众…查看详情
- 拼车软件有哪些?这五款是不错的选择
如果大家的家里面自己买得有车的话,就会发现其实自己开车的机会并不多。因为大家每天都要上班,如果自己开车去公司上班的话,就需要找好比较合适的停车位。而有的时候,停车位有可能刚好离公司非常远,所以这是非常不方便的。而拼车出行逐渐成为…查看详情
- 什么是oa系统?企业为什么要用oa系统?
随着OA办公系统逐渐掀起的热潮,越来越多的企业开始将目光投入到OA办公系统上,那么究竟什么是oa系统呢?企业为什么要用oa系统? 什么是oa系统? OA系统的英文全称是:OfficeAutomationSystem,中文全称是自动化办公系统…查看详情
- windows10自带ie怎么降级
Windows10自带的IE其实是IE11,目前已经是最新版本,不建议降级。但是,如果你确实需要降级,可以按照以下步骤操作: 1.从开始菜单中打开“控制面板”。 2.在控制面板页面中,找到“程序”选项,点击进入。 3.在“程序和功…查看详情
- 推荐几款电脑系统优化软件,轻松提升电脑的运行速度
相信有很多用户都遇到很大一个问题,电脑怎么莫名其妙就变卡了呢?开机时长越来越慢,加载网页时长越来越长等等。这是因为电脑里面垃圾信息文件等等太多了导致的原因,今天小编给大家推荐几款电脑系统优化软件,一起来看看吧! 1.Win…查看详情
- 干货!电商托管代运营协议范本参考
电商托管代运营是一种新的商业服务。电子商务本身是一个复杂的过程,需要技术和市场营销的双重支持,在网络日渐重要的当今社会,中小企业一方面迫切希望能通过网络开展电子商务,另一方面又受到经验少、专业人才缺乏和成本高企的限制。 因此电商务托管服务应…查看详情
- 专利侵权行为有哪些?
现代社会中,专利代表着一个物品的知识产权,也是法律对知识产权的保护,毕竟创造一个东西所要付出的时间、精力和代价是很大的,下面万商云集小编给大家详细介绍下专利侵权行为。 一、专利侵权行为 根据我国《民法典》的相关规定,主要在合同编规定了侵…查看详情
- 搜狗高速浏览器怎么样
搜狗高速浏览器是一款十分出色的浏览器,其拥有原生的极速引擎、高效的广告屏蔽、页面截图以及畅快无比的视频播放,同时还具有独特的搜索引擎核心,让我们不仅能够畅游互联网,而且可以更加方便快捷地搜索各种信息和资料。除此之外,搜狗浏览器还支持多个…查看详情
- 这应该是电脑上,最好用的5款电脑视频剪辑软件
现在随着互联网的飞跃腾达,许多短视频作者都需要一些电脑视频剪辑软件,在这个新时代的路上,互联网电商也越来越庞大,那么我们应该如何选择电脑视频剪辑软件呢?下面是给大家推荐的电脑视频剪辑软件!1.爱剪辑这款爱剪辑软件是国内首款免费的软件,从迄今…查看详情
- 便宜的crm系统有哪些?哪些因素会影响crm系统的价格?
对于中小企业来说,选择crm系统通常只考虑两点:一是功能是否满足基本需求,二是它是否是便宜的crm系统。那么今天小万就为需要节省支出的中小企业介绍一下crm系统是如何定价的,并推荐几个便宜的crm系统。 图片来源于网络 ▍ crm系统是怎…查看详情
- 4S店常用的汽修管理软件
现在市面上的4s店非常多,因为,汽车已经成为了大家必不可少的代步工具,所以,修车的店面也比较多,毕竟汽车也有坏的时候,对于修车店的老板如何管理,可以先看一下汽修管理软件有哪些? 1、智百盛 是一套实用性好、功能周全的汽车维修…查看详情
- 免费去除马赛克的app,轻松去除马赛克烦恼
喜欢的图片想要保存下来,但是上面却有难看的马赛克或者是水印的话,自然让大家十分烦恼,现在可以通过各种免费的趣马赛克APP,都能够轻松的去除这些标记,可以还原清晰的图片,那么下面就一起来了解,这几款好用的免费去除马赛克的APP吧。…查看详情
- 小程序开发报价浮动大的原因是什么?
由于市场对小程序的需求日益增加,于是就催生了很多第三方小程序开发公司。中小企业找到这些公司想要开发小程序,却又发现了其中的问题。同样的的需求,为什么不同的公司小程序开发报价浮动那么大,这都是什么原因呢?一起来了解下吧。 图片来源于网络影响小…查看详情
- 能自己制作图片的app手机做设计图的软件
照片是需要修饰的,如果只是普通的照片看上去不怎么显眼也不好看,如果用软件改一下的话看上去就会高一个档次,那么,在修图片之前,大家需要看一下制作图片的软件app都有什么? 1、制作图片软件 特别好用的专业摄影+后勤处置的图片类…查看详情
- 如果商标被注册该怎么办?改名、购买都可行
越来越多的商界朋友知道,商标专用权唯一获取的途径就是通过向国家商标局提交商标申请。随着越来越多的人申请注册商标,很多公司名字(商号)已经注册不了了,有时候好不容易想了一个很满意的商标名字,但又被别人注册了。如果商标被注册,碰到这种情况该怎么…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的数字选用平台

400-0033-166
8:30-18:00
















































注册有好礼



