一个好的作品集一般由多个项目构成
2020-12-31 14:59:13 阅读(231) 评论(0)
通常情况下,您需要将这些项目的数据集合起来,以便于将其整合成一个具有实际能力的项目。好消息是,你完全控制着自己的作品集。假如付出了一些努力,你就能打造出给用人单位留下深刻印象的高质量作品集。要打造高质量的作品集,第一步就是要弄清楚应该在作品中展示什么样的能力。公司希望数据科学家具备的能力(即他们希望作品集能展示的能力)包括:沟通能力与他人合作能力技术能力数据推断能力主观能动性一个好的作品集一般由多个项目组成,每个项目展示以上1-2个能力点。这篇文章是关于如何建立一个丰满的数据科学作品集的第三篇文章。本文将介绍如何创建作品集中的第二个项目,以及如何创建一个完整的机器学习项目。最后,您将拥有一个能够显示合理数据能力和技术能力的项目。如果您想要用这样的话,就可以很少的数据集合理解为业务价值。r/datasets—一个拥有数百个有趣数据集的subredditGooglePublicDatasets-GoogleBigQuery上的一些公共数据集Awesomedasets-Github上托管的数据集列表浏览这些数据集时,想想如果有这些数据集,人们可能会问什么问题,然后想想这些问题是否是一次性的(”S&P500和房价之间的相关性是什么?”,或者是可持续的(“你能预测股价吗?”)。这里的关键是找到那些可持续的问题。这些问题需要多次操作并输入不同的数据来回答。在本文中,我们选择房利美(FannieMae)贷款数据。房利美是一家由美国政府资助的从贷款人那里购买抵押贷款的企业。购买抵押贷款后,它将把抵押贷款打包成一些由抵押贷款支持的证券(MBS)在第一季度,我们可以预测哪些抵押贷款将被出售。这将有助于贷款人获得更多的抵押贷款,并为市场创造更大的流动性。从理论上讲,它将产生更多的住房所有者,然后产生更好的抵押贷款政策。然而,从借款人的角度来看,情况并没有什么不同。房利美公开了两种数据——购买的抵押贷款数据和抵押贷款性能数据。在最理想的情况下,一个人从贷款人那里借钱,然后一直还钱,直到贷款还清。然而,如果借款人多次未偿还,可能会导致抵押品赎回权的丧失。此时,银行将获得房屋所有权,因为它没有偿还抵押贷款。房利美记录了哪些抵押贷款没有偿还,哪些抵押贷款需要取消抵押品赎回权。这些数据每季度发布一次,并将滞后一年。在撰写本文时,最新的数据集是2015年第一季度。当房利美购买抵押贷款时,它将发布收购信息,包含有很多关于借款分数据,包括信息,包括信用评分和信用评分,这些信息,以及其中通常很难预测到每个季度是否有足够的。如果我们选择哪些抵押贷款分。 |R|OTHER|4.625|28000|360|2012|04/2012|31|1|23|801|N|C|SF|1|I|CA|945|FRM|10003735682|R|SUNTUSTMORTGAGEINC.|||3.99|4600||360||2012||2012|||2012|||2012||2012|||2012|||2012||||2012|||||2012||||||2012||||||2018||||||||||2012|||||||2012||||||2012|||||||||||||||2012|||||||2012|||||01||||2012||||||||||2012||||||||||||||||||。花点时间理解数据是非常有用的。特别是对于商业项目,除非一开始就找到它们,否则很难找到一些细节,因为我们没有互动来探索数据。在这种情况下,第一步是在房利美的网站上阅读相关数据集的材料:在阅读了这些材料后,我们了解了一些有用的关键信息:从2000年到现在,每季度都有收购文件和性能文件。数据滞后一年,所以最近的数据是,2015年的这些文件是文本形式。没有文档使用|作为分隔符,但我们列出的所有列表都加在一起。这些文件包含2200万抵押贷款数据,因为性能文件涵盖了以前的抵押贷款信息,因此在早期,抵押贷款将有更多的性能数据(例如,在设计项目结构和处理数据时,这些信息可以帮助我们节省很多时间。在下载和探索数据之前,设计项目结构是非常重要的。在下载和探索数据之前,设计项目结构是非常重要的。在创建一个完整的项目时,我们的主要目标是输出一个可行的解决方案来快速运行和消耗最少的资源,这样其他人就可以很容易地扩展项目,这样其他人就可以很容易地理解编写的代码越少越好。为了实现这些目标,我们应该设计项目的结构。一个结构良好的项目遵循以下规范:将原始数据和生成数据与数据文件和源代码分开.md文件介绍了如何安装和使用这个项目有一个requirementss.txt文件,包括项目所需的所有模块,都有settingss.py文件包含所有其他文件所需的设置,例如,如果有很多Python脚本读取相同的文件,最好让它们导入settings并从这个地方获取文件.Gitignore文件可以防止一些特别大或私人的文件被提交给Git,将任务分成几个步骤,并将其放置在可以单独执行的文件中。例如,用一个文件读取数据,一个文件建立特征,一个文件执行预测存储中间值。例如,一个脚本可能会输出另一个脚本读取的文件,这样我们就可以在数据处理过程中做出一些改变,而且不需要重新计算该项目的文件结构如下:loan-prediction├──data├──processed├──.gitignore├──README.md├──requirements.txt├──settings.首先创建loan-prediction文件夹,py创建初始文件。在这个文件夹中,创建data文件夹和procesed文件夹。在这个文件夹中,创建data文件夹和procesed文件夹。第一个用于存储原始数据,第二个用于存储所有中间值。接着,创建.gitignore文件。.gitignore文件将确保一些文件会被git忽略,而不会被推到github上。在每个文件夹中创建OSX。.DS_Store文件就是这种需要忽略的文件。要入门.这里可以参考gitignore文件。我们也应该忽略一些太大的文件,房利美的条款不允许再次发布这些文件,所以我们应该在那里.gitignore文件最后加上这两行:dataprocesed这里是这个项目的示例.gitignore文件。然后创建READMEE.md,这有助于人们了解项目。.代表本文件的markdown格式为markdown。Markdown可以让你直接用纯文本写作,但如果你愿意,你也可以添加一些漂亮的排版格式。这是markdown指南。如果你上传了一个叫做READMEE的Github.Github将自动处理md文件,并将其作为主页显示给访问者。这里有一个例子。目前,READMEE只需要.在md中放一个简短的描述:LoanPrediction-----------------------PredictwhetherornotloansacquiredbyFannieMaewillgointoforeclosure. FannieMaeacquiresloansfromotherlendersasawayofinducingthemtolendmore. FannieMaereleasesdataontheloansithasacquiredandtheirperformanceaft
推荐阅读
- txt小说阅读器好用吗
文本(txt)小说阅读器是一种用于阅读和管理文本格式小说的软件工具。它们通常提供简洁的界面、丰富的功能,并支持在电子设备上方便地阅读小说。以下是一些关于txt小说阅读器的讨论。 首先,txt小说阅读器具有使用便捷性。它们通常具有简洁的用户界…查看详情
- 淘宝购物小助手是什么?小助手该怎么用?
电商小助手小黄车怎么开通?1要开通电商小助手小黄车,需要安装相应的App并完成相*册流程,还需要支付一定的押金。 2电商小助手小黄车的开通需要进行身份认证和车辆信息录入,这些步骤比较繁琐,需要耐心完成。 3在完成开通后,用户可以随时使用…查看详情
- 新媒体运营人员至少用过一款或多款的作图软件
现在很多人都需要作图,包括一些专业非专业的学生,策划企业,广告设计公司等,都需要通过作图来完成工作或者去扩大营销,以下是我给大家推荐的作图软件。希望能够帮到您。01、PS很多用PS作图的,大多还是比较专业的设计师,毕竟PS也是做图的专业软件…查看详情
- 商标怎样申请注册?从申请到注册的流程怎么走?
商标申请人要想取得商标所有权,必须先提交相关资料并经过国家商标总局审核通过以后才行,那么商标怎样申请注册?申请到注册的流程怎么走?*将在下文中为您解答。对于经营者来说商标是十分重要的,能够区分其他生产者以及销售者的商品,体现出独特的商业价值…查看详情
- php中socket的用法示例详解
PHP的Socket怎么进行服务端与客户端的相互通信?谢邀~ 1.如果服务端是做成网页(J2EE)的话,那服务端Controller层暴露请求的URL,客户端使用HttpUrlConnection或开源的网络请求框架进行请求就可以了~服务…查看详情
- 作品类型不符登记规定怎么办?以游戏版权登记为例,为你讲解
原创作者为保障自己的权益,都会在作品完成后对其进行版权登记。现今可登记的作品类型有美术作品、文字作品、摄影作品、软件等,但如果想登记的作品并不符合可登记的作品类型该怎么办呢?以游戏版权登记为例,为你讲解。 图片来源于网络 ● 目前《著作权…查看详情
- 温馨提示:公司品牌商标注册 要搭建完整保护体系
塑造公司品牌是为了获得消费者的认同感,商标注册是为了提升标识的识别度,保护公司无形资产。公司品牌商标注册针对的是商标专用权,不仅仅要防止恶意抢注,还要注意搭建品牌商标护城河,为商标和品牌实施全面有效的防护。本站之前有一篇关于商标护城河的文章…查看详情
- 代运营好不好?该自己运营网店,还是找代运营?
随着电商行业飞速发展,越来越多的新手入驻淘宝平台,而正所谓有需求,就会有市场,开店铺容易想运营好却很难,所以代运营的崛起给商家看到新的趋势。而很多淘宝商家对代运营都有一些疑问:代运营好不好?图片来源于网络 代运营好不好?若是一个专业的代运营…查看详情
- 图片压缩软件有哪些 图片压缩软件排行榜
有时候我们经常会遇到发送图片时由于图片过大不得不进行压缩,压缩后的图片虽说能够发出去了,可是画质确实模糊得不行。今天就给大家分享3款好用的无损的图片压缩工具,让图片保存分享更轻松。下面*就给大家来详细介绍一下图片压缩软件有哪些 图片压缩…查看详情
- 专利权期限的起算点是什么时候?
专利权期限的起算点是多久?专利权的期限又是多久?如何对专利权进行转让呢?下面就由万商云集*给大家来详细介绍一下 专利权期限的起算点是什么时候这一块的相关内容,希望下面的内容能办这个到大家。 一、专利权期限的起算点是什么时候 …查看详情
- 好用的音乐制作软件有哪些 音乐制作软件排行榜
现在大家身边都有很多从事自媒体的朋友,而且现在制作短视频的话对音乐剪辑也是有一定的要求的,下面*就给大家来详细介绍一下好用的音乐制作软件有哪些 音乐制作软件排行榜这一块的内容,希望能帮助到大家! 好用的音乐制作软件有哪些 1、《…查看详情
- 盘点2021六款免费版*客服系统
大家都知道目前市面上有许多*客服系统打着免费的名义去欺骗企业,导致现在几乎找不到一款靠谱、安心、简单的*客服系统,但是今天我就来给大家盘点2021六款免费版*客服系统,绝对真实好用。 1.51免费版*客服系统 51*客服是客服系统的后起之秀…查看详情
- 疑问:代运营一般多少钱?要选择哪家代运营公司?
近几年电商行业的飞速发展,代运营应运而生,代运营的崛起给如今很多平台的商家都带来了好的趋势。但很多商家都会对一个问题有疑惑:代运营一般多少钱?下面小万就来和大家说说这个问题! 图片来源于网络 代运营一般多少钱?具体多少钱主要是根据收费模式来…查看详情
- 没货源怎么开网店赚钱
开网店赚钱是一个现在非常受欢迎的创业方式,但是如果没有足够的货源,那么如何开网店赚钱呢?其实,没有货源也不是不可能开网店赚钱,只需要从以下几个方面着手,就能开展自己的网店: 一、选择合适的产品 衣食住行是人们生活必需品,可以从这几个…查看详情
- jquery安装教程
如何离线安装jqueryui包?用户用搜索引擎搜索jquery-ui,找到jquery-ui的官网 找到官网后,进入jquery-ui的首页,jquery-ui点击download选项进入包的下载页面 选择需要下载的jquery-ui的…查看详情
猜你喜欢
最新文章

扫码二维码
立即领取《千元实战营销秘籍》
还可免费试用营销管理系统
*如有疑问,请随时拨打免费咨询热线:400-0033-166
邮箱:zjb@iwanshang.com
服务时间:8:30-18:00
软件企业
认定号:川RQ-2018-0216
高新技术企业
认定号:GR201951001121

关注微信公众号
和10万中小企业共同成长

扫码下载APP
享全方位服务一触即达
Copyright © 2004-2022 万商云集(成都)科技股份有限公司 版权所有
蜀ICP备12001963号-2
川公网安备 51010402000322号

快速找产品

找一找哪款产品适合您?
咨询热线:400-0033-166
-


-
电话沟通
获取方案
下载APP
官方微信
扫码下载APP
全方位服务一触即达

关注万商云集
和10万中小企共成长

TOP

企业首选的AI增效平台

400-0033-166
8:30-18:00















































注册有好礼



