服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

“数据科学”的演化及应用

2021-01-06 13:50:31 阅读(148 评论(0)

数据科学家如何变得性感的故事,大致就是统计学作为一门成熟学科如何与新兴学科的计算机科学发生关系的故事。“数据科学”这个术语出现较晚,用来指代一个需要解释大量数据的职业。但数据的解读历史悠久,多年来一直被科学家、统计学家、图书馆员、计算机科学家和其他人讨论。以下时间线可以追溯到“数据科学”一词的演变,以及它的应用、定义它的尝试和一些相关术语。1962年Johnw.Tukey在数据分析的未来(”TheFutureofDataAnalysis)写道:“长期以来,我以为自己是统计学家,对从特例中得到关于整体的推断感兴趣。但当我目睹了数学统计学的发展时,我产生了猜测和怀疑。。。我开始觉得我的基本兴趣在于数据分析。。。数据分析和一些相关的统计学必须承担更多的科学特征,而不是数学特征。。。数据分析本质上是一门经验科学。。。预设程序的电子计算机。。它有多重要?在许多情况下,答案令人惊讶:重要但不重要,计算机在其他情况下无疑是至关重要的。1947年,Tukey创造了“比特”(bit)“这个术语在1948年被Claudeshanonused用于“传播数学理论”(”AMathematicalTheoryofCommunications)一文中。Tukey于1977年出版了《探索性数据分析》(ExploratoryDataAnalysis),他在书中提出,我们应该更加关注使用数据来提出哪些假设需要测试的建议,以及探索性数据分析和论证性数据分析“能够并驾齐驱”。1974年,Peternaur在瑞典和美国出版了《计算机方法简要调查》(ConciseSurveyofComputerMethods)。这是一项关于当时使用的数据处理方法的调查,包括许多应用程序。本书遵循国际信息处理联合会的数据处理概念和术语指南(IFIPGuidetoConceptsandTermsinDataProcessing)“数据”的定义:“(数据是)必须能够以某种形式传播或操作事实或想法的标准化表现。根据这本书的前言,国际信息处理联合会于1968年展示了一份题为“数据学:数据处理的科学及其在教育中的地位”的课程计划。Naur为数据科学提供了以下定义:“数据形成后,处理数据的科学。数据与它所代表的东西之间的关系属于其他领域和科学范畴。1977年,国际统计联合会(TheInternationalAssociationforStatisticalComputing(IASC))作为国际统计研究院(ISI)成立了一个分支。“国际统计联合会的任务是将传统的统计方法、现代计算机技术与各领域专家的知识联系起来,将数据转化为信息和知识。“GregoryPiatetsky-Shapiro于1989年组织并主持了第一次数据库知识发现(KnowledgeDiscoveryinDatabases(KDD))研讨会。1995年成为国际计算机年会知识发现和数据挖掘的SIGKDD会议。1994年9月,《商业周刊》发表了一篇关于“数据库营销”的商业报道:“企业收集了大量关于你的信息,并将这些知识提炼成营销信息,准确地瞄准你。。。20世纪80年代扫描码器的繁荣在广泛的失望中结束:许多公司被总数据淹没,但无法获得有用的信息。。。然而,许多公司认为,他们别无选择,只能勇敢地站在数据库营销的前线。1996年国际分类协会联盟(InternationalFederationofClassificationSocieties(IFCS))双年会在日本神户举行。“数据科学”一词首次包含在会议标题中(“数据科学、分类等相关方法”)。联盟由六个国家/语言分类组织于1985年成立,其中一个是“分类协会”(TheClassificationSociety)成立于1964年。这些分类协会在其出版物中大量使用数据分析、数据挖掘、数据科学等术语。UsamaFayy1996年、GregoryPiatetsky-Shapiro、Padhraicsmyth出版了《从数据挖掘到数据库的知识发现》(FromDataMiningtoKnowledgeDiscoveryinDatabases”)。他们写道:“在过去,从数据中寻找有用的模式被赋予了许多名称,包括数据挖掘、知识提取、信息发现、信息收获、数据考古学和数据模式处理。KDD(数据库中的知识发现)是指从数据中获取有用知识的整个过程,而数据挖掘是指具体的环节之一。数据挖掘是利用特定算法从数据中提取的模式...KDD过程中的其他步骤,如数据准备、数据选择、数据清洗、与合适的已知识相结合、对挖掘结果的正确解读,对于确保从数据中获得有用的知识非常重要。数据挖掘方法的盲目应用(统计文献中被批评为“数据挖泥”(datadredging))可能是危险的,会得到无用的发现和无效的模式。”1997年C.F.密歇根大学统计系HeffWu教授(现在在乔治亚理工大学工作).C.在就职典礼上,Carver主席提出统计学应重命名为数据科学,统计学家应重命名为数据科学家。1997年《数据挖掘与知识发现》(DataMiningandKnowledgeDiscovery)期刊发行。这两个术语的顺序意味着“数据挖掘”地位的上升,并成为描述“从大数据库中提取信息”的一种更流行的方式。1999年12月,沃顿商学院Knowledge@Wharton的《从数据中挖掘知识的金块》引用了JacobZahavi的说法:“传统的统计方法在小数据集上工作得很好。但今天的数据库有数百万行和大量列……可扩展性已经成为数据挖掘的一个大问题。另一个技术挑战是开发一个模型,可以更好地分析数据,发现非线性关系和元素之间的联系……网站决策可能需要特殊的数据挖掘工具。WilliamS2001年.Cleveland出版了《数据科学:扩展统计技术领域的行动计划》(“DataScience:AnActionPlanforExpandingtheTechnicalAreasoftheFieldofStatistics”)。该计划“扩大统计领域技术工作的主要领域。雄心勃勃的计划包含了本质的变化。变化后的领域被称为“数据科学”。“Cleveland在计算机科学和当代数据挖掘工作中定位了这一新领域:“……数据分析师的收入有限。由于计算机科学家思考和分析数据的方法有限,统计学家对计算环境的知识有限。知识的融合将带来巨大的生产力创新。这意味着统计学家应该更加关注知识的计算,就像过去数据科学关注数学一样。数据科学系应该由致力于改进数据计算的成员和与计算机科学家合作的成员组成。2001年,LeoBreiman出版了《统计建模:两种文化》(“StatisticalModeling:TheTwoCultures”):在使用统计模型从数据中提取结论的过程中,有两种文化。假设数据是由特定的分布模型生成的。另一种是使用算法模型,并将数据结构视为未知。统计学界普遍致力于只使用数据模型。这种投资产生了毫无意义的理论和可疑的结论,使统计学家无法触及许多实际问题。在理论和实践中,算法模型在统计学之外发展迅速。它不仅可以应用于庞大而复杂的数据集,还可以在小数据集上建立大量准确信息的模型。如果我们的目标是使用数据来解决问题,那么我们需要摆脱对纯基于数据模型的依赖,并使用更多样化的工具。”

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

2021年餐饮行业收银系统最新排名,前5名高性价比推荐

现如今,伴随着物联网的全民化,智能控制系统的经营模式慢慢变成了餐企的“标准配备”,也是餐饮业市场需求的优点因素。针对店家而言,提升工作效能能够产生高些的盈利,而一个功能齐全的软硬件结账结账收银产品的确能够协助商家安心许多 。可是今日,iph…查看详情

外呼系统app怎么选?这几款重点推荐

现在的网络比较发达,也有很多产品采用电话销售的方式来完成任务,如果是这样的销售模式,那么就不能缺少一款好用的外呼系统APP了,这样不仅可以省心省事,更能够很好的节约成本和人力的资源。但是要注意,在选择外呼系统APP的时候,也要全…查看详情

网络推广引流的使用价值:可免费或低成本方式获得巨大流量

网络推广引流无论是对公司还是个人来说,都是一个获得流量的好方式。公司可以是为品牌曝光、宣传产品、销售转化,个人可以是为自己带来曝光和粉丝。 图片来源于网络 在互联网时代,流量为王。网络推广引流的价值,就是可以通过免费或低成本的方式来获得流量…查看详情

图片去马赛克恢复原图软件有哪些?好用的马赛克去除软件

在找图片的时候有一些图片是具有马赛克的,这样就不能够看到原图,所以说很多人都想要去除,马赛克其实想要去除马赛克也并不是一件难的事情,只要选择了很好的修复软件就能够进行操作。那么图片去马赛克恢复原图软件有哪些呢?接下来就给大家来介…查看详情

电视APP哪个好?这几款还不错

不少人在平时休闲的时候,就会通过看电视打发时间,正是因为顺应人们的需求,所以市场中也有很多好用的看电视APP,为大家的生活带来很多的方便,也有不错的观看体验,那么到底电视APP哪个好呢?这几款还不错,下面就通过文章的介绍,一起来…查看详情

免费的pdf阅读器有哪些 阅读pdf最好的软件推荐

在日常学习和工作生活中,我们都会浏览到一些pdf命名的文件格式的文件,那么有哪些软件可以轻松阅读pdf呢?下面是我给大家总结的6款可以免费使用的pdf阅读器,小伙伴们可以继续往下浏览。1.弘博PDF阅读器它是一款可以自动智能识别pdf阅读文…查看详情

集团crm系统的刚需功能和拓展性功是什么?

集团crm系统是在基础的crm系统上延伸出来的扩展版,根据集团企业的管理难点和企业特点进行了相应的功能开发,能够满足企业的多位一体、多区域、多渠道、多维度的管理体系。集团crm系统是大型企业、跨国企业的优质选择。图片来源于网络目前国内的CR…查看详情

六大门店系统排行榜,一般门店系统都有哪些功能

对于商家来说,做好门店的管理工作并不简单,一套优秀的门店管理系统可以帮助商家解决许多问题,能帮助商家打开运营门店捷径,你知道门店系统一般具有哪些功能吗?本文整理了一份六大门店系统排行榜,覆盖以下5款主流系统,排名不分先后。 1.hishop…查看详情

免费学日语软件哪个好 轻松学日语app

  小伙伴们在学习日语的过程中,是不是除了课本的学习,不知道还有什么好用的学习网站和APP呢?下面万商云集小编就给大家整理了几款免费学日语软件。希望大家能喜欢。    一、最最日语  从五十音图开始,零基础学习日语。教材齐全,市面上有的教材…查看详情

足球直播APP有哪些?好用的足球直播APP介绍

很多人平时的时候都特别喜欢看足球。有些软件就可以进行足球直播,而且选择到了好的软件之后,还可以进行足球方面的交流,是非常方便的。那么足球直播APP有哪些?相信很多朋友们对这个问题也都比较感兴趣,都想要找到一款比较好的足球直播软件…查看详情

免费录歌软件哪款好?这些都是精品

唱歌是一件非常愉快的事情,还可以帮助大家转换心情,和减轻工作和生活的压力,尽情的释放各种不良的情绪,而现在有很多录歌的软件,可以让大家一展歌喉,那么下面就来了解吧。 1、酷我K歌 这款软件可以说是,集合了找歌还有练唱为一体…查看详情

如何选择优质的老域名

  随着互联网的发展和普及,越来越多的企业和个人开始意识到,拥有一个好的域名对于网站的成功和品牌形象至关重要。而老域名作为一种稀缺资源,也受到越来越多人的青睐。那么,如何选择优质的老域名呢?本文将从以下几个方面进行详细的分析。  一、域名的…查看详情

微信小程序制作费用

制作微信小程序的费用因多种因素而异,包括开发复杂度、功能需求和开发团队的价格等。以下是关于微信小程序制作费用的一些重要考虑因素:1. 开发团队:费用可能与你选择的开发团队相关。有些公司和自由职业者的收费标准较高,而其他人可能提供更经济实惠的…查看详情

  小程序运行内存不足怎么解决

  小程序内存不足解决方法?  1、手机内存空间已满。这种情况我们可以删除手机中的一些软件,或清理一下微信缓存,腾出更多的空间来,然后重新打开微信。  2、手机后台占用过多。关闭后台所有运行应用,重新打开微信小程序即可解决。  3、如果以上…查看详情

低成本适合女孩开的店

  近年来,随着小微企业的蓬勃发展,越来越多的女孩开始想要有一份属于自己的事业。然而,创业需要资金的支持,对于许多青年女性来说,资金匮乏的问题十分突出。因此,低成本适合女孩开的店,成为了这一群体的追求目标。本文将详细描述,适合女孩开的低成本…查看详情

最新文章