服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

到数据科学实习是什么体验?真实经历告诉你

2020-12-29 14:13:13 阅读(155 评论(0)

写这篇文章的时候,是我在Quantuminventions数据科学家实习结束前的最后一天。现在,我坐在笔记本屏幕前,回顾过去几个月的学习之旅,感慨万千。请原谅我,作为一名物理学家,所有从事物理学的人都相信这一点:提出正确的问题,通过正确的推理寻求真理。事实上,提出正确的问题无疑是重要的数据科学家(稍后解释)。为了让您对本文有一个概念,本文主要分为三个步骤:实习前、实习期间和实习后,让您了解我的学习过程。根据你目前的学习阶段,你可以跳到本文的任何部分,让我们现在开始。在实习开始之前,我仍然清楚地记得,我在2017年11月期末考试后的第二天开始阅读教科书:统计导论:基于R应用程序(AnIntroductiontoStatisticalLearning — withApplicationsinR),这是我第一次在非常基本的统计层面接触机器学习。在我掌握了这些概念之后,我开始学习Andrewng在Coursrea上教授的机器学习课程。这门课很受欢迎。事情并不像一开始看起来那么容易,但安迪总能吸引人们的注意力。虽然他教的概念很复杂,但他简化了这些概念,其他人都能消化。我认为这就是让我真正痴迷于机器学习的方式。试试看,你会发现这个流行词“机器学习”并不像它听起来那么复杂。我敢打赌!同时,我还学习了人工智能的另一个关键领域——深度学习。为了让你知道看似奇怪的术语,请看神经网络的解释,以及如何使用神经网络来计算任何函数。如果你需要像我一样的可视化来了解神经网络在阅读我建议的文章后是如何工作的,请访问此网站[1](见文章末尾)。在此网页中,您点击“Play按钮可以观察神经网络是如何分类和回归的。不是很酷吗?在2017年12月开始实习之前,我已经为阅读、工作和学习做好了充分的准备。实习期间,Quantuminventions专注于利用其集成的移动应用套件为消费者、企业和政府提供移动智能。它们还提供了企业物流和分析平台。我是公司第一个加入R&D和分析团队的数据科学家实习生。在最初的几天里,我被介绍给公司的优秀同事,看到了行业中的各种通信术语和令人兴奋的项目。我最喜欢的实习之一是,作为一名实习生,公司给了我信任和自由,我可以选择我感兴趣的项目,并全力以赴!令我惊讶的是,我意识到我是这个项目的先驱,因为以前没有人做过这个项目。虽然这项研究存在不确定性和困难,但当没有人做某事时,就会有人去研究,这就是我所感激的。为什么这么说?这很简单,因为我有机会从零开始体验真正的数据科学工作流程(如果不是全部)。因为这些都是我在数据科学领域建立的基础,所以请允许我在这篇文章中简要列出我所经历的工作流程。我希望这些能给你一些帮助。1.了解业务问题所选项目是对公路短期旅行时间的预测。然而,正如我所说,数据科学家提出正确的问题是非常重要的。无论是可用的数据源,还是项目的最终目标(即使我离开项目后),都要在项目完成前提出很多问题,才能真正理解真正的业务问题。本质上,我们的目标是使新加坡高速公路的行驶时间预测比目前的基线估计更准确。2.收集数据源接管新项目后,我非常兴奋,开始从数据库和同事那里收集数据源(基本上是在办公室四处走动,询问数据源问题)。收集正确的数据源,就像你从不同的网站获取数据进行数据预处理一样。这项工作很重要,因为它可能会影响你在后期建立的模型的准确性。3.数据预处理要知道,现实世界的数据很脏。我们不能寄希望于Kagle提供格式好、清洗过的数据。因此,数据预处理非常重要(其他人可能称之为数据整理或数据清理),因此我不能再强调它的重要性。数据预处理是最重要的阶段,因为它可以占整个工作过程的40%~70%,只是为了清理将为您提供模型的数据。我喜欢数据科学的一点是,你必须对自己诚实。当你不知道你在哪里无知,你认为预处理的数据足够干净,并准备为你的模型提供数据时,就有风险:用错误的数据构建正确的模型。换句话说,如果数据在技术上符合你所拥有的领域知识,你应该始终试图质疑自己,严格审查数据,检查整个数据集中是否有其他异常值、缺失或不一致的数据。在我错误地将错误的数据输入到模型中后,我非常小心,只是因为预处理步骤中有一个简单的缺陷。4.经过一些研究,我为项目提出了支持向量回归的四个模型。(SupportVectorRegression,SVR)、多层感知器(MultilayerPerceptron,MLP)、长短期记忆网络(LongShortTermMemory,LSTM)和状态空间神经网络(StateSpaceNeuralNetworks,SSNN)。为了简洁起见,您可以在网络上找到上述模型的详细说明。为了简单起见,您可以在互联网上找到上述模型的详细描述。对我来说,从零开始构建不同的模型是一条陡峭的学习曲线,因为我仍然在MOOC和教科书中学习。幸运的是,Scikit-learn和Keras(带TensorFlow后端)帮我解决了这个问题,因为在Python中很容易获得快速的模型原型和实现。此外,我还学会了如何优化模型,并使用几种技术来微调每个模型的超参数。5.为了评估每个模型的性能,我主要使用以下指标:平均绝对误差(MeanAbsoluteError,MAE);均方误差(MeanSquaredError,MSE);可决系数(CoefficientofDetermination(R2))。在此阶段,重复步骤3~5次(可交换),直到确定最佳模型,足以超过基线估计值。实习结束后,实习肯定再次激发了我对数据科学的热情。我非常感谢我的工作能给我未来的工作留下一些吸引力。研发阶段、与不同利益相关者沟通所需的技能、用数据解决业务问题的好奇心和热情(这里只举几个例子)都有助于我对这个领域感兴趣。数据科学行业还很年轻。对于像我们这样的求职者来说,对这个行业的职位描述似乎有点模糊和模糊。如果你没有所有你需要的技能,这是正常的,因为大多数职位描述都是理想化的,以满足雇主的最佳期望。如果你有问题,你只需要从MOOC开始、在书籍和文章中学习基础知识(我现在还在做),并将你学到的东西应用到你的个人项目或实习中。耐心点,因为学习需要时间。享受你的学习过程,因为...当你有问题时,从MOOCs开始、在书籍和文章(我现在还在做的)中学习基本原则,并将你所学到的应用到你的个人项目或实习中。要有耐心。学习之旅确实需要时间。津津有味地学习你的旅程。因为..最后,旅程结束后,问题依然存在:你学到了什么?那是你想要的吗?感谢您的阅读。我希望这篇文章能为您提供一些简单的(非详细的)数据科学工作流程和我的学习过程文档。

内容来源:AI前线,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

开店铺小程序如何做?

  小程序怎么设置我的专属门店?  小程序设置我的专属门店方法如下:  1.  电脑打开微信网页版,在微信公众号后台点击“立即注册”  2.  在该页面点击注册微信服务号并认证,进入下一页面  3.  在微信服务号后台复用资质注册并认证小程…查看详情

微博打不开了怎么回事 微博打不开淘宝链接怎么回事

  微博是中国最大的社交媒体平台之一,淘宝则是中国最大的电商平台之一。这两个平台都是中国互联网的重要组成部分,每天都有数以百万计的用户在上面进行交流和购物。但是,有时候这些平台可能会出现一些问题,例如微博打不开,淘宝链接无法访问等等。下面我…查看详情

好用的钢笔有哪些 好用的钢笔排行榜

现在的孩子上学,老师都会要求孩子用钢笔写字,因为用钢笔写字更加规范一些,可以从小培养孩子的写字习惯,从小就写一手好字,那么,我们需要先知道钢笔排行榜有什么,选择品牌去购买。 1、威雅(PARKER)钢笔 推荐原因:只可以用极…查看详情

专利权的转让合同形式有几种?

专利所有权人转让专利的,应当和受让人签订书面的转让合同。下面万商云集小编就给大家介绍下专利权的转让合同形式有几种。  一、专利权的转让合同形式有几种  1、专利所有权人转让专利的,应当和受让人签订书面的转让合同。  2、所以,专利转让合同的…查看详情

青苹果系统怎么样

青苹果(GreenApple)是一个虚构的概念,没有与之对应的实际操作系统。因此,无法提供关于"青苹果系统"的详细信息或评价。 然而,如果您指的是苹果公司的iOS操作系统(也称为苹果系统),那么以下是关于该系统的一些常见特点和评价: iOS…查看详情

智能短信营销 精准营销新发展

随着互联网科技的不断发展,同类别产品越来越多,在行业内的竞争也日益激烈,APP的获客成本不断升高、微信公众号打开率下滑、传统短信渠道更如隔靴搔痒,企业在探索互联网的过程中遇到了比以往更多的阻碍,这些阻碍在某种程度上都催化了市场对于新服务入口…查看详情

小米系统更新怎么关闭

下面将为您介绍在小米手机上如何关闭系统更新。小米手机的系统更新功能可以帮助用户获取最新的系统版本和安全补丁,以提供更好的使用体验和保护设备安全。然而,有些用户可能出于个人需求或其他原因,希望暂时关闭系统更新。以下是一种简单的方法来达到这个目…查看详情

万商云集线上集市来啦,快看老板们如何卖货

心动不如行动,2020的双11盛宴,有你必将更加精彩! 期待您的留言,我们将精选3位粉丝,分别赠送10屏电梯广告,为您的企业推广添砖加瓦!了解更多活动详情、参与活动,点击下方链接或扫描二维码进入。↓↓↓https://mp.weixin.q…查看详情

最常见的erp模块有哪几个?

erp,就是企业资源计划软件,它主要是通过几个最常见的erp模块将企业各方面的信息全部集中到该系统之中进行分类管理,并实现各部门之间数据实时共享,增加企业各部门之间的沟通和协作。今天,小万将为大家介绍一下最常见的erp模块有哪几个。图片来源…查看详情

好用的在线播放软件介绍,带给大家畅爽体验

现在不少人都会通过看视频来放松心情,可以起到释放压力的作用,而如果没有选对软件的话,不仅会遭受卡顿的烦恼,还会经常出现广告,也会十分的影响观看的体验,那么下面就为大家介绍几款,在线的播放软件,这些软件可以让大家有更为畅爽的观感。…查看详情

注册一个公司需要些什么资料

  注册一个公司是开展商业活动的一个重要步骤,它代表着企业要开始正式经营的阶段。但是在注册公司之前,您需要进行大量的准备工作和了解相关法律法规。在本文中,我们将详细描述注册公司需要的具体步骤,并且强调一些您需要特别关注的方面。  一、确定公…查看详情

玄幻小说排行榜完本前十名,你最爱哪部?

相信很多人都有属于自己的英雄梦,而通过看玄幻小说,就能够很好的满足精神的需求,同时也可以放松身心,这也是玄幻小说之所以有很大吸引力的原因之一了,那么下面就针对于玄幻小说排行榜完结前十名,为大家进行相关介绍。 1、斗破苍穹 …查看详情

独角兽企业是什么意思?

  独角兽企业是投资行业,尤其是风险投资业的术语,其被视为新经济发展的一个重要风向标,主要在高科技领域,互联网领域尤为活跃,下面小编就给大家来介绍一下独角兽企业是什么意思?这一块的内容。  一、什么是独角兽企业?  独角兽企业指的是投资界对…查看详情

jkmal00b华为是什么型号

华为jkn-al00b型号?华为al00b是畅享9Plus的手机,华为畅享9Plus完整型号为JKM-AL00b有华为畅享9Plus高配版全网通6GB+128GB和4GB+128GB两种。 华为畅享9Plus是华为公司于2018年10月1…查看详情

【类别整理】节目商标注册需要全面查询、及时注册、实时监控

影视行业因为传播辐射范围的特殊性,节目制作单位或播出单位在节目播出或拍摄前都需要进行节目商标注册。因为商标只能用于核准使用范围,影视节目名称成功注册后,该节目的服务就应该被纳入商标注册用商品及服务国际分类。图片来源于网络节目名称一般注册的类…查看详情

最新文章