服务热线:400-0033-166
万商云集 - 企业数字化选用平台

企业首选的

数字选用平台

如何通过用户历史行为数据建立信用评分模型?

2021-01-05 10:27:53 阅读(285 评论(0)

摘要:面向小微企业和个人消费的小微信贷是当前互联网金融的重要发展方向,正在经历爆炸性增长。在这个增长过程中,如何通过互联网大数据分析实现快速准确的信用信息,没有实物抵押,是一个非常重要的问题。为此,不同的数据来源将为信用评估提供依据。本文将对用户的历史行为数据进行分析和讨论,建立信用评分模型,并通过该模型提高信用评估的预测效果。1、业务介绍行业介绍小微信贷,我们将其定义为金额小、无抵押担保、完全依赖信用的贷款行为。小微信贷可以面向个人(2C)或小微企业(2B)。对于2C业务,通常是小额短期信用贷款,这是一种人民币信用贷款,用于解决借款人的临时消费需求,期限不到一年,金额不到20万元,无需担保。对于2B业务,由于小微企业的信贷需求特点是“短、小、频、急”,这种小、短、分散的特点更类似于零售贷款,对资本流动性的要求更高。小额信贷的产生有其深刻的市场原因。在2B层面,小微企业受到传统金融机构的歧视和排斥,资金供给严重不足最终导致小微企业营养不良。主要原因是小微企业抵押品不足。传统的银行贷款往往需要企业提供足够的抵押品。小微企业正处于发展的初级阶段,刀口必须使用有限的资金,因此只有少量资金可用于购买土地、房地产等固定资产。因此,传统银行在小微业务中产品较少。这导致小微企业的融资需求与银行产品不匹配。另一方面,许多小微企业的财务报表不完整,导致信息不对称。银行对他们了解不够,不敢轻易借钱。事实上,对于银行来说,与大企业相比,小微信贷业务的成本更高,这也导致了银行贷款动力的不足。相反,在互联网平台上,信息不对称性在一定程度上降低,资本供需双方在降低交易成本的同时直接对接,一些电子商务平台也开始为平台上的中小企业提供融资信贷服务。图1银行的大企业贷款和小微企业贷款为2C。个人信用贷款主要用于购车、房屋装修、旅游等消费,但一般不能用于支付购房款。一般来说,信用良好、固定住所、收入稳定、还款能力充足的人可以申请信用贷款。传统的信用审计仍存在效率低、速度慢、准确性差等缺点。由于这些问题,很难适应互联网信贷的审计模式。另一方面,对于普通大众来说,信用卡可以控制的信用额度是有限的。所以,仅仅依靠现有的金融产品并不能满足用户对贷款金额及时性的细化需求。网络信贷的出现将更快地匹配这一过程,从而大大降低时间成本。自余额宝推出以来,互联网金融产品如雨后春笋般涌现。移动互联网正逐渐渗透到传统金融的各个环节,旨在使金融能够以更低的成本、更多样化的方式和更好的体验覆盖更多的人。网络信用平台通过互联网对小额信用贷款进行了改造,使更多的小微企业和个人有了融资渠道,这一过程变得更加便捷。由于小额贷款中的贷款没有抵押和担保,唯一依赖的是个人或企业的信用,因此信用调查过程非常重要。我们*的是如何利用互联网平台的大量信息来帮助我们快速准确地完成这个过程。马云在给阿里巴巴员工的一封内部邮件中表示,以控制为出发点的IT时代正在激活生产力(datatechnology)数据时代。随着计算机技术的发展,基于大数据应用服务的大数据运算变得越来越现实。大数据在营销领域的应用将广告转化为“窄告”精准营销,在互联网金融普及的背景下,大数据在金融业信用调查中的应用也在逐渐兴起。2015年1月5日,中国人民银行发布《关于准备个人信用调查业务的通知》,公布了首批获得个人信用调查许可证的8家机构名单,这八家机构有:腾讯信用调查有限公司、芝麻信用管理有限公司、深圳前海信用调查中心有限公司、鹏源信用调查有限公司、中成信用调查有限公司、中成信用调查有限公司、拉卡拉信用管理有限公司、北京华道信用调查有限公司。央行信用调查中心是一个基本数据库,已批准的个人信用调查机构将提供一些增值和创新服务。中央银行的信用调查中心是一个基本数据库,批准的个人信用调查机构将提供一些增值和创新服务。因此,在信用调查平台上,各行各业的英雄将使用自己的数据来展示自己的魔力。如何在B2C或P2P平台上使用大量互联网数据来帮助完成信用调查的过程,是我们今天希望在互联网上不断颠覆传统的东西。本研究的目的是通过收集到的用户历史行为数据,建立一个预测用户信用评分的模型。本文的数据收集来自一家小型贷款公司。为了数据隐私,本文将隐藏部分数据信息和分析结果,但不影响分析结果的客观性。具体来说,我们称提供数据的公司为熊小贷(匿名),其业务包括2B业务和2C业务。通过自身的综合数据分析,公司对2B和2C业务获得了统一的用户信用评分,称为熊评分。然而,熊的得分广泛针对公司的所有产品和用户,因此对特定产品的信用评分对用户违约的预测精度不高。熊小额贷款公司希望通过产品用户独特信息的数据支持,为特定产品建立用户信用评分模型。预期目标是通过数据支持建立的产品用户信用评分模型,预测用户是否违约的准确性高于通用熊评分。从图3可以直观地了解公司的2B和2C业务,包括不同用户的不同产品。例如,熊分期付款是为熊得分超过400分的用户定制的产品。在手机客户端下载APP“熊小贷”,点击进入即可开始信用生活。然后点击“熊分期付款”进入产品页面,用户将被要求注册并填写个人信息。图3熊小额贷款公司的产品概况将根据收集到的用户信息建立信用评分模型,匹配公司数据库中的用户交易行为信息,以及使用“熊分期付款”产品贷款的用户的违约。这种信用模式将从业务目标和业务背景出发。该模型以预测用户信用评分为参考,并直接指导业务层面是否可以向用户发放贷款。第二章将重点介绍具体的数据采集和变量清理过程,第三章将介绍模型建立。二、数据描述数据收集熊小额贷款公司股东有第三方支付渠道,可以通过银行卡收集独特的用户交易信息,注册用户只要通过第三方支付渠道交易,可以记录,通过用户手机号码,可以搜索用户的历史交易行为数据。该数据源具有其独特的优势,直接避免了传统信用调查行业用户自填数据的重大问题:a.对个人或企业进行评级刻画时,维度相对单一,无法获得全面的立体评级;b.伪造财务数据的可能性更大,如工资自填。如果用户夸大了公司的水平,以获得贷款审批,小额贷款公司很难确认;c.交叉验证缺乏其他数据,降低评级的可靠性。但熊小贷公司收集的数据比传统数据丰富得多。然而,熊小额贷款公司收集的数据比传统数据要丰富得多。熊小额贷款公司收集了上述产品“熊分期付款”对应的注册用户信息近3万条,自注册应用程序以来的总交易量近450万行,以及相应的其他信息。这些交易信息的时间间隔超过一年。其中违约用户近1万,非违约用户近2万。值得注意的是,为模型建立的抽样数据并不意味着实际注册用户中违约用户与非违约用户的比例。具体而言,熊小额贷款公司“熊分期付款”产品对应的注册用户数据结构主要包括以下四种表格,即交易事实表、用户信息表、商户分类信息表和银行卡信息表。它们之间的关系如图4所示。这四张表格分别通过不同的关键字连接,具体如下:a.用户信息表可以对应用户的手机号码和交易事实表,一个用户的手机号码对应多个交易事实记录;b.商户分类信息表可通过商户编号和交易事实表对应,一个商户号可能会产生多个交易事实;c.银行卡信息表可以通过银行卡的前几位数字(称为卡标首)对应交易事实表中的卡号。四张表格中包含的具体变量信息如下:用户信息表:手机号码、注册渠道(手机APP注册或网站注册)、身份证(提供的数据已加密)、提取数据前的最新登录时间、注册时间等。商户分类信息表:创建时间、商户号、商户名、商户1级分类代码、商户1级分类代码、商户2级分类代码、商户3级分类代码、商户3级分类代码、商户4级分类代码、商户4级分类代码等。银行卡信息表(银行卡类型信息):卡标头(银行卡的前几位数据决定了属于哪家银行的卡类型)、首长(例如,如果前六位数字决定了卡类型,则首长为6)、账户类型、账户类型名称(如储蓄卡或信用卡)、卡代码、银行代码、银行名称等。交易事实表:自来水号码(每笔交易将设置自来水号码)、交易手机号码、交易时间、商户号码、账单号、支付金额(支付金额等于账单金额加费用总额)、账单金额、手续费等。综上所述,上述四种表格可以通过不同的关键字进行匹配和连接,以便对应用户的多行交易信息。在下一节中,我们将详细阐述数据的变量提取过程。综上所述,上述四个表格可以通过不同的关键字进行匹配和连接,以便对应用户的多行交易信息。在下一节中,我们将详细阐述数据的变量提取过程。图4熊分期付款产品用户数据结构数据清理变量收集首先,根据关键字合并所有四个表格。每个观测行数接近450万条,包括用户个人信息、银行卡信息、商户分类信息等。直接处理不是一个很好的解决方案,因此产生的数据量太大,不直观地有利于分析。我们的目标是将所有信息汇总给每个用户,并定义用户的衍生变量。因此,我们将用户特征分为两个方向,即用户基本信息变量和用户分类信息变量。接下来,我们将详细定义它。用户基本信息变量生成的用户基本信息变量包括可以直接从数据中收集的变量和衍生变量,如下所示:(1)用户熊得分:由于原始综合熊得分预测精度的目标,我们将“熊得分”作为解释变量进入模型,“熊得分”是熊贷款公司业务人员根据实际业务定义指标系统生成的得分,我们认为它有一定的业务经验和背景知识,所以它也有很强的预测能力。熊得分越低,违约的可能性就越大。熊得分越低,违约的可能性就越大。(2、3)用户性别、用户年龄:用户性别、年龄信息可以通过用户身份证号码提取。我们通过与熊小额贷款公司的沟通完成了这些数据,熊小额贷款公司并没有直接提供用户的身份证号码。所获得的身份证信息均为加密信息。(4)用户注册年龄:即用户从第一次有交易记录开始,以天为单位。(5)交易数量:用户从第一笔交易记录开始,记录的交易总数。(6)所有行为的平均值:用户记录的所有交易行为的平均金额。(7)所有行为的最大值:用户从第一笔交易开始,所有交易行为的最大值。该指标可以衡量用户的极端行为。直观地说,用户的极端行为越大,违约的可能性就越大。(8)贷款比率:在用户的所有行为中,使用信用卡(或信用卡)的交易次数占使用信用卡或借记卡(或储蓄卡)的所有交易次数的比率。这一指标衡量了用户的交易习惯。例如,有些人习惯于直接使用储蓄卡消费,而另一些人则习惯于每月使用信用卡消费,然后在还款日按时还款,这样他们就可以在不影响每月财务计划的情况下消费。这两种消费习惯的用户群体是不同的。(9)银行卡数量:我们每个人需要的银行卡数量不多,银行卡太多的用户不同于正常用户群体。举例来说,如果需要多张信用卡消费,但是没有信用卡的人更容易违约。通过以上信息,我们定义了上述9个用户的基本信息变量。在信用调查问题中,用户分类信息变量和RFM模型通常面临一个典型的问题,在这种情况下也是如此。当用户对应多种行为关系时,如何根据一套既定的指标系统对个人进行总结?在这种情况下,每个用户对应的交易记录从几十到一千不等。我们可以将其归类为不同类型的交易,如在超市购物、购买游戏卡、支付水、电、气费等。对应每一类行为,都需要以标准化的方式计算对应每个人的变量,以衡量对应一系列行为的人的特征。为此,我们介绍了营销中常用的RFM模型(见美国数据库营销研究所Arthurhughes的研究)。在营销领域,RFM模型是衡量客户价值和创利能力的重要工具和手段。该模型通过三个指标来描述客户的综合价值:最近的购买行为、购买的总体频率和花费多少钱,具体如下:(1)R(Recency),最后一次消费是指从最后一次购买到现在的距离。理论上,最后一次消费时间越近的用户应该是相对活跃的用户。因此,这些用户最有可能对提供即时商品或服务做出反应。我们通常会发现,用户在0到6个月内收到营销人员超过31到36个月的沟通信息。(2)

内容来源:数据分析网,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

win10正版多少钱一套

  Win10正版的收费标准  Win10正版的收费标准是由微软公司制定的,目前在中国大陆地区的官方售价为998元/套,也就是说,用户需要花费近千元的价格才可以购买到一套正版的Win10系统。  此价格只是针对个人用户而言,对于企业用户和教…查看详情

浴霸十大品牌

  1、阿特美家-浴霸十大品牌之一  阿特美家作为国内浴霸的知名品牌之一,其产品在市场上一直都有着较高的口碑和知名度。其产品主要集中在智能浴霸、豪华浴霸、中档浴霸、低档浴霸等多个档次,可以满足不同消费者的需求。阿特美家的产品主要以一体成型、…查看详情

4款操作简单不用去电脑店,自己也能重装电脑系统软件

不管是笔记本电脑还是台式电脑,我们都必须要进行装机,才可以确保电脑的流畅度,一旦出现不流畅的情况,不管是打游戏还是看电视都会影响心情,因此,一键装系统的软件有哪些? 1、360系统重装大师 是一款*重装的专用工具,采用好的安…查看详情

微博怎么发文章 微博发文章技巧

  微博是基于用户关系的社交媒体平台,用户可以通过PC、手机等多种移动终端接入,以文字、图片、视频等多媒体形式,实现信息的即时分享、传播互动。绝大多数人玩微博的目的就是为了更好地阅读资讯,得到自身感兴趣的一些信息内容。为了时时刻刻关注自己的…查看详情

了解商标注册受理事项,如受理周期、通知书下发时间...

商标注册受理,其实就是指提交商标注册申请和资料后,由相关人员进行初步审核后,确定是否此商标注册申请。简单来说,商标注册受理就是告诉你,商标局接受该申请并开始进行审查。 图片来源于网络 商标注册受理事项一:商标注册申请被受理是成功通过吗? 不…查看详情

零经验新手怎样做电商

没有经验的新手可不可以做电商呢?怎样做电商可以避免采坑呢? 新手当然可以做电商,电商行业的大佬也从零经验慢慢做到现在的高度的。而且现在新手做电商的环境比以前好了很多,怎样做电商可以避免采坑的问题也能得到解决。有很多前人的电商经营经验可以,很…查看详情

安装eclipse的详细步骤

linux环境下怎么安装eclipse?在linux下安装eclipse方法: 一.下载eclipse安装包(.tar.gz)下载地址:http://www.eclipse.org/downloads/建议下载那个forJ2EE的,嘿嘿,…查看详情

一款先进的企业管理工具——总管家CRM

总管家CRM,销售管理好帮手!这是一款基于移动互联网模式,适合销售团队和销售员个人使用的客户关系管理软件。系统以客户为中心,具备完善的客户资料管理、订单收款管理、销售业绩督导、客户跟单流程、数据报表分析以及日程任务审批等OA办公功能。总管家…查看详情

公司注销后专利属于谁 公司注销后专利归属

    在平时很多的小伙伴都不知道公司注销后专利属于谁的基本情况,而且对公司注销后专利属于谁都不是很熟悉,下面万商云集*就为大家整理了公司注销后专利属于谁这方面的相关内容,希望下面的内容能帮助到各位。    一、公司注销后专利归属  除非原…查看详情

四款测温软件24小时守护宝宝,1分钟快速测温

现在有很多比较先进的东西,测温这方面设置的也越来越先进,不需要温度计就可以测量温度,对于小宝宝来说是一种*,那么,我们需要提前了解一下测温软件都有什么这个问题。 1、24小时不断监控 24小时不断监控小孩体温,2秒左右收集一…查看详情

淘宝网店客服怎么做

网店客服是通过网店的一种服务形式,通过网络,开网店,提供给客户解答和售后等的服务,称为网店客服。网店客服主要是针对网店客服就是阿里软件,提供给淘宝掌柜的在线客户服务系统,旨在让淘宝掌柜更高效的管理网店、及时把握商机消息,从容应对繁忙的生意。…查看详情

根据调查数据而总结出的几款好用浏览器

网络的普及,对于浏览器的使用已经有了非常成熟的使用市场,这里根据浏览器使用的调查数据做个总结,毕竟浏览器使用内卷严重了呀。不过优质浏览器还是有共性的:要求简洁干净不附加七七八八的补丁,以下是笔者的一些搜集分析: 1、谷歌 …查看详情

网络销售怎么样?网络销售具有什么特点?

随着互联网的发展,网络信息化时代的到来,网购平台现在的发展趋势,已经是我们无法想象的了,网购是指网上进行购物,那么这就联系到了网洛销售。网络销售具有低成本,灵活度高,不会受到时空的限制。那么网络销售怎么样呢??下面*为大家介绍,网络销售都有…查看详情

注册商标与未注册商标的区别:外观不同、法律地位不同

大家在商场购买东西的时候,都会看见各种各样的商标,这个商标有的是还在申请中,有的是已经注册完成的。申请中的和已经注册完毕的商标是不同的,下面,小万整理了注册商标与未注册商标的相关知识,为了帮助大家更好的了解商标知识。图片来源于网络 注册商标…查看详情

同样是《尼泊尔公约》成员国,美国版权要不要登记?

《尼泊尔公约》主要涉及对作品和作者权利的保护,世界上大多数国家都是该公约的成员国,美国也是成员国之一。该公约的核心就是成员国都应自动保护联盟所属的其它各国中首先出版的作品和和保护其作者是上述其他各国的公民或居民的未出版的作品。在《公约》的保…查看详情

最新文章