学习数据科学,应该从哪里开始?
2020-12-28 09:50:04 阅读(164) 评论(0)
你对学习数据科学感兴趣,但不知道从哪里开始?假如是这样,那你就来对地方了。我遇到过很多对学习数据科学充满热情的人,但仅仅几周后,他们就放弃了学习。我想知道为什么一个人对一个领域如此热情却不去追求它。通过与他们中的一些人交谈,我了解到人们放弃学习的主要原因是:为了成为一名数据科学家,他们必须学习太多的话题。他们遇到的领导者说,要成为一名数据科学家,他们必须是一名有才华的程序员、数学专家和应用统计大师,并且非常熟练地使用panda、Numpy等python库。这些甚至会吓到一位经验丰富的数据科学家,难怪他们会让那些试图学习数据科学的人放弃。上面的每一个话题都像一片海洋。当有人试图快速掌握它们时,他们会感到沮丧,放弃学习。真正的事实是,如果你想成为一名成功的数据科学家或数据科学家,你甚至需要掌握更多。如何学习数据科学成为一名数据科学家,你需要从以下项目中学到足够的知识:如果Python或R编程的基本知识选择Python,那么像panda和numpy这样的库可视化库,如gggplot、Seaborn和Plotly。SQL统计数据编程数学,尤其是线性代数和微积分,在下面的视频中,我提到了学习数据科学的分步指南。我已经解释了不同数据科学专业水平所需的知识深度。如何计划学习?应该首先涉及哪些主题?让我解释一下100天学习数据科学的计划。以下是Python学习数据科学的日常计划。该计划跨度为100天,每天至少需要一个小时。第一天:安装工具只需确保所需工具的安装,您可以在接下来的几周/几个月内感到舒适。如果选择Python,安装Anaconda,包括IDEsJupyter笔记本和Spyder。假如你选择'R然后安装RStudio。试着在IDE中玩,熟练地使用它。例如,试着理解包/库的安装,执行一些代码,清理内存等等。从第二天到第七天:数据科学的基本编程下一步是学习基本编程。以下是一些应该学习的主题:创建变量字符串数据类型和通常执行在字符串数据类型上的操作值数据类型、布尔值和操作符合数据类型列表、元组、集合和字典-了解它们之间的独特性和差异非常重要。If-Then-Else条件、For循环和While循环实现函数和Lambda函数——它们各自的优点和差异从第8天到第17天:Pandas库了解Pandas库,Pandas中需要了解的一些主题是:创建数据帧,从文件中读取数据。并将数据帧写入文件,从数据框架中索引和选择数据迭代和排序聚合,以及处理Pandas的重命名和替换,并在数据帧中进行连接、合并和连接总结分析、交叉表、枢轴数据、分类和稀疏数据,因为这些主题在实施探索性数据分析时非常有用。在介绍这些主题时,请尝试深入了解粒度细节,如合并和连接、交叉表和枢轴之间的差异,这样你不仅可以了解每一个,还可以知道何时何地使用它们。在介绍这些主题时,请尝试深入了解粒度细节,如合并和连接、交叉表和枢轴之间的差异,这样你不仅可以了解其中的每一个,还可以知道何时何地使用它们。我为什么要学习Pandas?如果你从事任何数据科学项目,它们总是从探索性数据分析开始,以便更好地理解数据,而你在Pandas中介绍的主题将派上用场。此外,由于Pandas有助于从不同的来源和格式读取数据,它们速度快、效率高,并为数据集执行各种操作提供了简单的功能。NumpyLibrary在NumpyLibrary学会Pandas后,下一个需要学习的重要库就是Numpy。与List相比,学习Numpy的原因非常快。Numpy的主题包括:为什么学习Numpy所需的数据元素,用于创建索引和切片数据类型的连接和分离搜索和排序过滤?Numpy可以以快速高效的方式对数据进行科学操作。它支持机器学习算法中常用的高效矩阵运算,Numpy也广泛应用于panda库。从第23天到第25天:现在,我们需要花一些时间来理解和使用一些关键的可视化库,如ggplot、Plotly和Seaborn。使用示例数据集,尝试不同的可视化,如柱状图、线/趋势图、盒状图、散点图、热图、饼状图、柱状图、气泡图等有趣或交互式可视化。数据科学项目的关键是与参与者沟通洞察力,可视化是实现这一目标的好工具。下一个要讨论的重要主题是统计,探索平均值、中位数、众数、范围分析、标准差和方差等常用的描述性统计技术。然后介绍一些更深层次的技术,如识别数据集中的异常值和测量误差范围。了解这些统计测试在现实生活中的应用,作为探索各种统计测试(如下所示)的最后一步:F-Testanova卡测试Testa-TestZ-Test从第36天到第40天:现在是时候学习SQL进行数据分析了,因为在大多数企业用例中,数据将存储在数据库中,了解SQL将极大地帮助从系统中查询所需的数据进行分析。可以先安装一个开源数据库,比如MySQL,它会附带一些默认数据库,只需要处理数据,学习SQL。如果你能集中精力学习以下内容,那就太好了:从表中选择数据,根据键连接不同表中的数据,使用case语句和筛选条件,对数据进行分组和聚合。–50天:探索性数据分析(EDA)在任何数据科学项目中,大约80%的时间都花在这个活动上,所以最好花时间彻底学习这个主题。这里不涉及一组特定的功能或主题来学习探索性数据分析,但数据集和用例将驱动分析。为了学习探索性数据分析,这里不涉及一组特定的功能或主题,但数据集和用例将驱动分析。因此,最好使用kagle主办的一些样本数据集来学习如何进行探索性分析。另一种学习探索性数据分析的方法是编写关于数据集的问题,并试图从数据集中找到答案。例如,如果我考虑最受欢迎的泰坦尼克号数据集,然后试图找到问题的答案,比如哪个性别/年龄/甲板的人有更高的*概率。随着时间的推移,你的综合分析能力会提高,所以要有耐心,慢慢自信地学习。到目前为止,你已经学习了数据科学家所需的所有核心技能,现在你可以学习算法了。数学怎么了?是的,了解线性代数和微积分很重要,但我宁愿不花时间学习数学概念,但当他们需要的时候,你可以参考和复习你的技能,高中数学就足够了。例如,假设你正在学习梯度下降法,你可以花时间学习它背后的数学知识,同时学习算法。因为如果你开始学习数学的重要概念,那么它可能非常耗时,通过学习,你会学习足够的时间,但如果你开始学习数学的所有概念,那么你会花更多的时间,学习远远超过你需要的。从第51天到第70天:在前10天监督学习和项目实施,学习一些关键算法,了解它们背后的数学原理,然后在接下来的10天里专注于开发一个项目。本课的一些算法包括:线性回归和逻辑回归决策树/随机森林支持向量机(SVM)在最初的10天里,重点应该是理解你选择的算法背后的理论。然后花点时间了解每个算法比其他算法更合适的场景,比如当数据集中有很多分类属性时,决策树是最好的。然后在Kagle中选择一个解决方案的例子,你可以找到很多解决方案来尝试重新执行它们,但仔细理解每行代码,并理解它们的原因。到目前为止,你已经获得了良好的理论知识和工作知识的解决方案。最后一步是从数据收集、探索性分析、特性工程、模型构建和模型验证开始,选择一个项目,实现一个有监督的学习算法。会有很多问题和问题,但是当你完成项目的时候,你会对算法和方法有很好的了解。从第71天到第90天:是时候关注非监督学习,类似于在监督学习中使用的方法了。花几天时间理解你在非监督学习中选择的算法背后的概念,然后通过实施一个项目来学习。这里要讲的算法是聚类算法——用于数据集中识别聚类关联分析——用于识别数据中模式主成分分析—用于减少属性的数量推荐系统——用于识别类似用户/产品并推荐的初始日子,应该关注理解上面的算法和技术,了解每个人的目的。他们可以使用的场景,如主成分分析,通常用于数据集降维。当你在一个非常大的列中工作时,你想要减少,但仍然保留信息和推荐系统。基于客户的购买模式,您可以推荐他们可能感兴趣的其他产品来增加销售。当您熟悉理论和场景时,您可以选择一个解决方案的例子,并通过逆向工程学习,即理解每行代码并重新执行它们。当您熟悉可以使用的理论和场景时,您可以选择一个解决方案的例子,并通过逆向工程学习,即理解每行代码并重新执行它们。作为最后一步,是时候根据你所学到的东西选择用例并实现它们了。当你完成项目/用例时,你会学到很多东西,你会更好地理解这些算法,这将永远伴随着你。从第91天到第100天:自然语言处理基础利用这段时间关注非结构化/文本数据的分析和用例。值得花时间在这里的东西很少学会使用API从公共源获取数据来执行一些基本的情绪分析——可以使用来自TwitterAPI的数据来提取特定标签的Tweet,然后计算这些Tweet背后的情绪和情绪主题建模——当有大量的文档,你想把它们分成不同的类别时,这种方法是非常有用的!现在,您已经介绍了所有可以申请任何数据科学工作的重要概念。我在YouTube频道开始了为期100天的数据科学学习教程。如果你感兴趣,请加入我,在这里开始你的数据科学学习教程。有些人可以在100天内成为数据科学家是的,就像任何人都可以在几天内学会游泳一样,任何人都可以在100天甚至更短的时间内学习数据科学。但就像游泳一样,如果你想成为一名优秀的游泳运动员或奥运会游泳运动员,你必须通过努力和不断的练习,数据科学,通过不断的练习和努力,你可以成为一名专家。如果我继续遵循这个教程,我能学到多少?在教程结束时,您将有足够的知识从事典型的数据科学项目。这样,你就可以打破学习障碍,所以你可以继续学习数据科学的高级主题,只要你付出最少的努力和支持。在最后的信息开始之前,事情可能看起来太复杂了。不要不知所措。一步一步地继续你的学习之旅可能需要一些时间,但你会到达你的目的地。
推荐阅读
- 外贸独立网站运营的天赋优势、环境优势和基本技巧
外贸独立网站是拥有独立域名和独立网站自主权的对外贸易网站,优势在于“独立”,独立代表了营销推广不受限制,而外贸独立网站运营的核心就在于“独立”优势,可以将网站运营成“外贸营销型网站”,这是外贸独立网站的第一优势。图片来源于网络● 外贸独立网…查看详情
- 网上卖房子怎么发布
随着互联网的发展,网上买卖房屋已成为一个非常流行的趋势,在互联网上发布房产信息已经成为很多房主和经纪人的常规操作。而如何发布房屋信息以便快速被寻找,吸引更多的潜在买家,是一个非常重要的问题。下面将详细描述如何在网上卖房子。 1.选择合…查看详情
- 录屏软件哪个好?五款免费好用的录屏软件推荐!
随着经济的快速发展,手机的设计也越来越多样化,手机逐渐出现了录屏功能,但是还有很多人想要录屏形式多样化,新颖化,不用着急,今天我就来给大家盘点一下那些免费的录屏软件,包大家满意!1.PPT录屏经常需要录制网课的老师,PPT录屏就是最好用且做…查看详情
- 品牌是知识产权吗?权威且全面的回答
品牌是知识产权吗?在有关知识产权的采访中,中国社会科学院法学研究所研究员李德顺充分回答了这个问题,他表示:“品牌本身实际上是我们讲的商标、商号、商誉和知识产权的统称,品牌本身并不是法律的术语,所以要保护品牌才能发展品牌,而保护品牌主要要靠知…查看详情
- 内衣网店代理商是怎么做的,需要符合哪些条件
想做卖衣服的网店代理,要怎么弄?首先,衣服代理是需要代理费,找一个招衣服代理的厂家,商家,和他们咨询,当然,交易方式,售后,都需要网店为基础,不然再诱人也不要信,基本钱都是有去无回在淘宝上做代理商需要什么条件?1年满16.有身份证,符合注册…查看详情
- 青岛标志设计需要知道那些要素?
企业logo设计对图片像素和比例的要求有哪些?网页设计的标准尺寸有800*600、1024*768的,在PS里可以在800*600的状态下显示全屏,页面的下方有不会出现滑动条的,尺寸为740*560左右,这些说的比较笼统,如果你想要真正专业…查看详情
- 专访银都餐饮丁文:通过数字化转型,为客户提供高效迅捷的服务
银都餐饮设备股份有限公司总部位于浙江杭州,已有18年商用餐饮设备行业的历史。公司产品涵盖商用餐饮冰箱、西厨设备、自助餐设备等,客户以各类商业餐饮店、中大型酒店为主,具有专业的生产流水线,产品质量优越,售后服务高效。作为国内商用餐饮设备的龙头…查看详情
- 离线看小说哪个软件好-离线txt小说阅读器
小说现在已经成为了我们日常生活中必不可少的一部分,当我们工作累了可以看小说解压,其中包括言情、幽默等一些小说,能缓解我们的心情,那么,很多人都不清楚离线看小说哪个软件好一些。1、快读免费小说快读免费小说是一款软件,该软件的软件大小为2.6M…查看详情
- 气体灭火系统的类型有几种
气体灭火系统是一种常用于保护重要设备和场所的灭火装置,其工作原理是通过释放特定类型的气体来控制、扑灭火灾。以下是几种常见的气体灭火系统类型:1. 灭菌剂气体灭火系统:这种系统使用化学灭菌剂,如二氧化碳(CO2)、卤代碳化合物或氟化物等,通过…查看详情
- 微信小程序开发平台具有哪些优势?五大优势详解
微信小程序可以说得到了很好的发展,而且使用量也是非常高的,能够带来更多的引流。正是因为这样,很多的企业和电商也都会选择制作微信小程序,这样才能够得到更好的发展,其实微信小程序开发平台是很不错的,能够帮助企业带来更好的发展,也能够…查看详情
- 2022年六大iphone备份软件
大家是否有过没有及时备份一些信息而消失的烦恼,这就是苹果手机的弊端,今天我就来给大家推荐几款2022年六大iphone备份软件,保证这些软件会是你所喜欢的软件,你肯定不会放弃他们,好好选择适合你的软件吧。 1.通讯录云备份…查看详情
- 手机通讯录管理软件有必要用吗?用了才知道好
手机显然已经成为人们生活当中不可或缺的重要工具,非智能机时代手机通讯录成为人们与外界连接的号码媒介,在智能机时代手机通讯录的管理同样具有不可替代的作用与意义。尤其是手机内储存了大量牵扯人际关系的手机号码时,人们总是希望能够对手机…查看详情
- 数据库管理工具有哪些?2021年最火的6款数据库管理工具推荐
数据库管理工具是一种用于管理数据库管理工具的计算机软件系统,一般有储存、截取、安全保障、备份等基本功能。数据库管理工具主要完成数据管理的操作及管理功能,实现数据库管理工具对象的建立.数据库管理工具资料的查询。增加、删除及使用者管理数据库管理…查看详情
- 怎么找买房的精准客户
如何找到买房的精准客户 房地产行业一直是一个竞争激烈的行业。作为买房的精准客户,往往是房地产公司最为*的对象。然而,在如今市场竞争加剧、信息过载的时代,如何找到买房的精准客户,成为了房地产公司需要面对和解决的难题。本文将从以下几个角度…查看详情
- 不懂分析没法做专业报表?瑞云服务云这款报表设计器可以拯救你
当前,经济的全球化、技术的进步使得制造企业提供的产品越来越趋向于同质化,为了应对越来越激烈的竞争,企业必须打造出独特的、高附加值的服务,才能提升产品差异化,增加企业核心竞争优势。 但是真正做到满意服务,使服务展现出无可取代的价值,就需要一款…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
邮箱:zjb@iwanshang.com
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的AI增效平台

400-0033-166
8:30-18:00















































注册有好礼



