服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

数据科学的这5个坑,你踩过吗?

2020-12-28 13:52:23 阅读(133 评论(0)

当我读到这篇文章时,我非常感动。我踩过大部分坑。许多学生刚毕业参加工作,或者刚转行进入大数据领域。对于学生来说,他们可能更关注模型的优化和算法的改进,而数据通常是固定的,因为这样,我们就可以评估不同算法的优缺点,但来到公司后,一切都反过来了。算法和模型可能是一样的,数据是决定最终结果的关键。这篇文章给了你几个数据科学家刚开始工作时很容易踩到的坑。让我们看看他们是否被抓住了。这篇文章给了你几个数据科学家刚开始工作时很容易踩到的坑。让我们看看他们是否被抓住了。你终于成为了一名数据科学家,你参加了Kagle的比赛,你疯狂地看了Coursera的课程。你觉得你已经准备好了,但数据科学家的现实生活可能与你所期望的不同。这篇文章列出了早期数据科学家容易犯的五个错误。这个列表是Dr.Sé与bastienFoucaud一起整理,Dr.Sébastienfoucaud在学术界和工业界指导年轻数据科学家已有20多年的经验。这个博客主要是为了帮助你准备成为一名数据科学家。我们开始1。进入“Kagle一代”,你参加了Kagle比赛,练习你的数据科学技术。你可以建立决策树和神经网络,这很好。但说实话,你做的不像真正的数据科学家。记住一个常用的规则,把80%的时间花在处理数据上,剩下的20%的时间来构建模型。在很多方面,成为“Kagle一代”是有帮助的,数据通常清理得很好,你可以花很多时间来调整你的模型。然而,事实并非如此。你需要从不同的地方收集数据。这些数据有不同的格式和命名方法。做这些困难的工作,完善你的技术,花80%的时间在数据预处理上,从API上捕捉图片,从Genius上收集歌词,为特定的问题准备数据,然后开始机器学习的生命周期。毫无疑问,成为数据预处理的专家会让你成为你公司最重要的数据科学家。2.神经网络是所有解药深度学习模型,在计算机视觉和自然语言处理方面超过其他机器学习方法,但也有明显的缺点。神经网络非常吃数据。对于少量样本,你会发现决策树或逻辑回归模型往往更好。神经网络基本上是一个黑盒子,在可解释性方面很有名。如果产品经理闻到这个模型的输出,你需要解释这个模型,传统模型就容易多了。这个博客上有很多优秀的统计学习模型。你可以自学,了解这些模型的优缺点,并根据你的使用场景使用不同的模型。除非你的工作领域是计算机视觉或自然语言处理,否则使用传统机器学习的可能性仍然很大。在许多情况下,你会发现简单的模型,比如逻辑回归,是最好的模型。3.机器学习是指在过去的几十年里,产品机器学习受到了高度赞扬和大量宣传的痛苦。许多初学者认为机器学习可以解决所有的问题。机器学习本身不是一种产品,机器学习是创造满足用户需求的强大工具。如果用户需要准确的项目推荐,可以进行机器学习。如果用户需要准确识别图像中的物体,可以进行机器学习。如果公司需要向用户推送有价值的广告,可以进行机器学习。作为一名数据科学家,你需要计划一个项目,把用户的目标作为你的首要任务,然后评估机器学习是否能做到。4.混淆了过去几年的因果关系,产生了90%的数据。随着大数据的出现,机器学习实践者获取数据要容易得多。如此多的数据需要评估,学习模型随机相关性的机会也随之增加。上图显示了美国小姐的年龄和所有死于蒸汽、热量和热量的物体的总数。给出这个数据,学习算法会学到美国小姐年龄对死于特定物体的人数的影响,反之亦然。但事实上,这两个数据并不相关。在探索数据中的模式时,使用你的专业知识可能是一个原因或关系吗?回答这个问题是从数据中获取行为的关键。5.优化和部署错误的测量。机器学习模型符合敏捷的生命周期。首先,您定义了一个思想和关键测量指标。第二,您通过构建原型给出结果。第三,您继续优化以满足您的关键测量指标。在构建机器学习模型时,记住手动做错误分析。这个过程非常困难和费力,但它将帮助你在下一个迭代中有效地改进你的模型。看看这篇文章,里面还有一些其他的提升模型的技巧,吴恩达的DeeplearningSpecialization.年轻的数据科学家花了很多时间在公司身上。他们很年轻,可以通过在线课程立即创造价值。他们经常自学。一些大学为数据科学家提供学位,这可以提供保证。他们对这个领域充满热情,渴望学到更多。记住上面提到的陷阱,成功开始数据科学家的第一份工作。关键点:练习数据管理,学习不同模型的优缺点。模型越简单越好。最有价值的指标是通过原因vs的相关性来检查你的结论,优化

内容来源:AI公园,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

参考液晶电视销量排行榜,选择合适的家用液晶电视

因为现在很多人都想要追求比较高清的观影模式,所以会想要为家庭选择一些液晶电视机,但是因为自己在选择电视的经验不是很充足,所以就会陷入两难的抉择,具体可以参考以下的液晶电视销量排行榜。1、酷开酷开始终走在世界的前列,因为在电视领域深耕了多年以…查看详情

小白必看 | 版权登记保护范围

我们在生活中方方面面都与版权打着交道,又随着大家对版权意识的逐渐增强,版权保护、版权登记愈发重要。但即便大家有这样的意识,不过对于版权的相关内容也依旧谈不上熟悉。接下来,小万就来为大家介绍一下关于版权登记保护范围吧! 图片来源于网络 ▍ …查看详情

【供参考】版权登记作品说明书模板+范文

对于没有版权登记经验的新手来说,最好地选择其实是委托版权登记代理公司代为办理。如此,无论是登记流程还是资料填写(如版权登记申请表、版权登记作品说明书等),亦或是后续进度跟进,都无需自己再操心或因为不知如何操作而延误进度。 图片来源于网络 但…查看详情

小编带你了解具体的服装购物网站排行榜

大家网上购物不仅仅是买一些日用品了,更多的人会选择在网上购买一些服装,而且现在互联网资源发展的比较好,有专门的服装购物网站供给大家使用,具体来说有以下的服装购物网站排行榜。 1、唯品会 唯品会其实专门做的是衣服品牌,而且大…查看详情

2021hr管理软件免费版排行榜

一款高效的hr管理软件免费版可以帮到企业降低成本增加效率,加快数字化进程。那么市面上我们应该如何精准的选择一个hr管理软件呢?我们对数款软件进行了测评,最终整理了这篇2021hr管理软件免费版排行榜。 一、hrSaaShr管理软件免费版 一…查看详情

制作幻灯片软件有哪些 制作幻灯片软件排行榜

  现在很多的场景都会使用到ptt,而且大家经常会制作ptt,下面小编给大家来详细介绍一下制作幻灯片软件有哪些 制作幻灯片软件排行榜这一块的相关内容,下面的这些软件都是制作ptt比较简单的,。  制作幻灯片软件排行榜  1、《PPT在线…查看详情

盘点钮门快递系统的作用与亮点

随着科技发展的日新月异,物流行业的成长也是十分迅猛,与此同时针对其研发的各种快递系统更是开始大批出现在人们的视野当中,那么哪款快递系统才是真正适合大众的呢?在这里我要为大家推荐钮门快递系统,下面我会为大家一一盘点钮门快递系统的作用与亮点。 …查看详情

手机浏览器哪个好用速度快

手机浏览器是我们在移动设备上用来访问互联网的主要工具之一。选择一个好用速度快的手机浏览器对于提高我们的上网体验至关重要。以下是一些被认为速度较快且功能齐全的手机浏览器。1. Google Chrome:Google Chrome是一款受欢迎…查看详情

B2B网站建设需要注意哪些方面?

B2B网站是是现阶段比较成熟的一种网站,能实现商家之间直接交流合作,提升双方的满意度。很多企业在B2B网站建设方面更是始终不得窍门,难以发挥出网站的最大功能。现在就来了解一下进行B2B网站建设有那些方面是需要着重注意的。B2B网站建设需要注…查看详情

淘宝新店如何提升信誉值

现在很多网购消费者在淘宝上购买宝贝的时候,都会看商家的信誉值,如果商家的信誉不好,可能会直接pass掉,这就给新入驻淘宝的店长带来了难题,新店没有信誉难道就不能在淘宝上开店赚钱呢吗,答案当然是否定的,不然淘宝也就没有存在的价值了。我们需要明…查看详情

windows10截屏快捷键是哪个

  Windows 10是一个非常流行的操作系统,它拥有许多方便的快捷键,其中一个常用的功能就是截屏。在日常的工作中,我们常常需要捕捉屏幕上的某些部分或全屏内容,以便于向他人或自己进行展示或保存。因此,Windows 10提供了多种快捷…查看详情

企业产品好、服务好,为什么要做网络推广?

为什么要做网络推广?一定要做网络推广吗?这是企业老板十分疑惑并想寻求一个答案的问题。尤其是认为自己产品好、服务好,在市场中具有竞争优势的老板,对此更加疑惑。图片来源于网络 为什么要做网络推广?当企业老板了解网络推广的优势后,相信心中会明了。…查看详情

光端机是什么设备

光电转换器和光端机的区别?区别1:功能不同。光纤收发器和光电转换器只有光电转换的功能,光端机具有联网控制,身份验证,光电转换,协议转换等功能。 区别2:使用环境不同。光纤收发器和光电转换器用于局域网远距离通信。光端机是宽带出口设备用于…查看详情

小服装店收银系统有安装的必要吗?

部分运营者会存在这样一种思维,只有规模大一点的服装店或者连锁品牌才用得到服装收银系统,对于小服装店收银系统有安装的必要吗这个问题一直存在疑惑,对于这些店面来讲,服装收银系统真的没有用吗? 答案是有必要,但在系统选型时建议商家选择对应业务需求…查看详情

微信小程序PHP后台实现的方法

公众号小程序怎么开发?1.注册成为微信公众号开发者。 2.进入“开发”页面,申请开通小程序功能。 3.进入小程序管理后台,创建一个新的小程序。 4.下载小程序开发工具,进行开发和调试。 5.编写小程序代码和UI界面,与后端服务器交互…查看详情

最新文章