导读:今天首席CTO笔记来给各位分享关于金融大数据风控接入需要多少的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
大数据风控多数只是摆设
大数据风控多数只是摆设
互联网时代效率为王,传统风控占用大量资源,终被舍弃。不知何时,大数据技术兴起。大量数据多维度、智能、批量处理和标准化的执行,另其在金融风控里占有了一席之地。金融机构间的竞争将大数据风控推的越来越高……数千维度现如今,需要风控的金融机构或多或少都会涉及大数据风控。有观点认为,不少金融机构用大数据概念拔高高度,而实际的技术还不成熟。事实上,金融机构大数据风控做的质量可以从维度的数量上看。学历、手机号、性别、居住地等都是一个维度。也曾有金融机构表示自家风控模型中有2000多个维度。刘玥是一家做大数据风控多年金融机构的首席数据官,曾在谷歌任职多年,有丰富的数据分析经验。“现在,做大数据风控的金融机构,维度数量对外说普遍是1000多,实际上用到的可能不到百分之十。”刘玥直言。据了解,金融机构接入的大数据金融机构越多维度就越多,虽然维度大部分是重复的,但金融机构为了提高档次,一般不会剔除。刘玥称,1000多个维度算是少的,即使上万个维度也不是不可能。最近,刘玥领导的建模团队在规模相当的一家金融机构挖来了一名建模人员,扩充至20人。据这名建模人员透露,上家金融机构建模人员只有两名,自己走了只剩下一名了。事实上,维度再多,模型不丰富,在专业骗贷小分队面前也是虚有……骗贷思维“专业的骗贷团队会向金融机构申请贷款,观察申请结果,然后对的这家金融机构的风控模型进行分析。”刘玥表示,如果以大专学历申请失败,而以本科学历申请成功,这条维度就被分析出来了。有相关业内人士透露,此前出现的大规模骗贷就这在维度泄露或维度被分析出来的情况下出现的。风控模型越简单,维度越少,风险就越大。据此前一本财经报道,骗贷者获取一套虚假资料,只需2000元,却可骗贷20多万。钱一到手,人就消失,成为永久“坏账”。在刘玥看来,金融机构的大数据风控共可以分为四个层次。一、直接购买简单的风控模型,简单直接,具有初级风险的判断。二、自主开发,较为简单,有5-10个维度。三、自主开发,模型复杂,且同时有多个模型,一条信息同时通过几个模型或是经过一个后再经过另一个模型。四、除了第三种模型以外应有的模型以外,增加机器学习算法,用于反欺诈行为。“纯粹依靠大数据风控放贷的只有现金贷产品。”有业内人士表示,这也是现金贷利息高的原因。为时尚早在目前看来,我国数据市场规模巨大,消费需求旺盛,越来越多的数据被记录和整理,用户行为信息日益完善,大数据必定会成为这个时代的关键技术。然而,准确的预测分析虽然能帮助金融机构降低因欺诈、信用违约导致的坏账风险,有效的控制成本,但是目前大数据技术的发展尚属初级阶段,技术尚不成熟。尤其是运用到以风控为核心的金融领域还为时尚早。“我国信用体系不健全,金融机构依托线上风控,并不能实现最佳效果。”厚本金融副总裁欧阳君直言,“线下风控这一模式,在我国仍然会存在并将持续很长一段时间。但是金融机构依然要学习国外先进技术,提高决策效率,做好线上风控。”此前,有多家金融机构曾表示,确实在做大数据风控,但实际应用微乎其微。其中,有金融机构透露,大数据风控只是用户借款的一个门槛,用户通过了大数据的审核后还会进行人工审核。欧阳君称,虽然风险的规避不是百分之百,但是通过大数据概率去做风控,会让金融机构的整体方向好转。
互联网金融风控模型,需要多大的数据
1、基于某类特定目标人群、特定行业、商圈等做风控
由于针对特定人员、行业、商圈等垂直目标做深耕,较为容易建立对应的风险点及风控策略。
例如:
针对大学生的消费贷,主要针对大学生人群的特征
针对农业机具行业的融资担保。
针对批发市场商圈的信贷。
2、基于自有平台身份数据、历史交易数据、支付数据、信用数据、行为数据、黑名单/白名单等数据做风控
身份数据:实名认证信息(姓名、身份证号、手机号、银行卡、单位、职位)、行业、家庭住址、单位地址、关系圈等等。
交易数据/支付数据:例如B2C/B2B/C2C电商平台的交易数据,P2P平台的借款、投资的交易数据等。
信用数据:例如P2P平台借款、还款等行为累积形成的信用数据,电商平台根据交易行为形成的信用数据及信用分(京东白条、支付宝花呗),SNS平台的信用数据。
行为数据:例如电商的购买行为、互动行为、实名认证行为(例如类似新浪微博单位认证及好友认证)、修改资料(例如修改家庭及单位住址,通过更换频率来确认职业稳定性)。
黑名单/白名单:信用卡黑名单、账户白名单等。
3、基于第三方平台服务及数据做风控
互联网征信平台(非人行征信)、行业联盟共享数据(例如小贷联盟、P2P联盟) FICO服务
Retail Decisions(ReD)、Maxmind服务
IP地址库、代理服务器、盗卡/伪卡数据库、恶意网址库等
舆情监控及趋势、口碑服务。诸如宏观政策、行业趋势及个体案例的分析等等
4、基于传统行业数据做风控
人行征信、工商、税务、房管、法院、公安、金融机构、车管所、电信、公共事业(水电煤)等传统行业数据。
5、线下实地尽职调查数据
包括自建风控团队做线下尽职调查模式以及与小贷公司、典当、第三方信用管理公司等传统线下企业合作做风控的模式。
虽然貌似与大数据无关,但线下风控数据也是大数据风控的重要数据来源和手段。
消费金融的大数据风控怎么玩
展开全部
可以接入第三方大数据公司的风控方案,通过对用户行为大数据的挖掘和分析,可以分析到群体用户或个体用户的行为标签,比如,日常消费行为标签、出行标签、兴趣爱好标签、资产理财标签等,通过这些标签可以形成该用户的行为画像,以此来为风控提供决策。比如,透过大数据可以看到该用户经常在高端商城购买奢侈品,并且ta在其他平台的信贷记录中无不良情况,这就在一定程度上表明该用户的收入和消费级别定位,在授信时可以作为参考,从而实现既给ta充分授信,提高ta的消费能力的同时,又把授信风险降到了最低,防止欺诈、拖欠等行为出现。
如何利用大数据做金融风控
大数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据风控,典型的场景是互联网金融的大数据风控。
金融的本质是风险管理,风控是所有金融业务的核心。典型的金融借贷业务例如抵押贷款、消费贷款、P2P、供应链金融、以及票据融资都需要数据风控识别欺诈用户及评估用户信用等级。
传统金融的风控主要利用了信用属性强大的金融数据,一般采用20个纬度左右的数据,利用评分来识别客户的还款能力和还款意愿。信用相关程度强的数据 纬度为十个左右,包含年龄、职业、收入、学历、工作单位、借贷情况、房产,汽车、单位、还贷记录等,金融企业参考用户提交的数据进行打分,最后得到申请人 的信用评分,依据评分来决定是否贷款以及贷款额度。其他同信用相关的数据还有区域、产品、理财方式、行业、缴款方式、缴款记录、金额、时间、频率等。普惠在线
互联网金融的大数据风控并不是完全改变传统风控,实际是丰富传统风控的数据纬度。互联网风控中,首先还是利用信用属性强的金融数据,判断借款人的还 款能力和还款意愿,然后在利用信用属性较弱的行为数据进行补充,一般是利用数据的关联分析来判断借款人的信用情况,借助数据模型来揭示某些行为特征和信用 风险之间的关系。
互联网金融公司利用大数据进行风控时,都是利用多维度数据来识别借款人风险。同信用相关的数据越多地被用于借款人风险评估,借款人的信用风险就被揭示的更充分,信用评分就会更加客观,接近借款人实际风险。
常用的互联网金融大数据风控方式有以下几种:
验证借款人身份
验证借款人身份的五因素认证是姓名、手机号、身份证号、银行卡号、家庭地址。企业可以借助国政通的数据来验证姓名、身份证号,借助银联数据来验证银行卡号和姓名,利用运营商数据来验证手机号、姓名、身份证号、家庭住址。
如果借款人是欺诈用户,这五个信息都可以买到。这个时候就需要进行人脸识别了,人脸识别等原理是调用国政通/公安局 API接口,将申请人实时拍摄的照片/视频同客户预留在公安的身份证进行识别,通过人脸识别技术验证申请人是否是借款人本人。
其他的验证客户的方式包括让客户出示其他银行的信用卡及刷卡记录,或者验证客户的学历证书和身份认证。
分析提交的信息来识别欺诈
大部分的贷款申请都从线下移到了线上,特别是在互联网金融领域,消费贷和学生贷都是以线上申请为主的。
线上申请时,申请人会按照贷款公司的要求填写多维度信息例如户籍地址,居住地址,工作单位,单位电话,单位名称等。如果是欺诈用户,其填写的信息往 往会出现一些规律,企业可根据异常填写记录来识别欺诈。例如填写不同城市居住小区名字相同、填写的不同城市,不同单位的电话相同、不同单位的地址街道相 同、单位名称相同、甚至居住的楼层和号码都相同。还有一些填写假的小区、地址和单位名称以及电话等。
如果企业发现一些重复的信息和电话号码,申请人欺诈的可能性就会很高。
分析客户线上申请行为来识别欺诈
欺诈用户往往事先准备好用户基本信息,在申请过程中,快速进行填写,批量作业,在多家网站进行申请,通过提高申请量来获得更多的贷款。
企业可以借助于SDK或JS来采集申请人在各个环节的行为,计算客户阅读条款的时间,填写信息的时间,申请贷款的时间等,如果这些申请时间大大小于 正常客户申请时间,例如填写地址信息小于2秒,阅读条款少于3秒钟,申请贷款低于20秒等。用户申请的时间也很关键,一般晚上11点以后申请贷款的申请 人,欺诈比例和违约比例较高。
这些异常申请行为可能揭示申请人具有欺诈倾向,企业可以结合其他的信息来判断客户是否为欺诈用户。
利用黑名单和灰名单识别风险
互联网金融公司面临的主要风险为恶意欺诈,70%左右的信贷损失来源于申请人的恶意欺诈。客户逾期或者违约贷款中至少有30%左右可以收回,另外的一些可以通过催收公司进行催收,M2逾期的回收率在20%左右。
市场上有近百家的公司从事个人征信相关工作,其主要的商业模式是反欺诈识别,灰名单识别,以及客户征信评分。反欺诈识别中,重要的一个参考就是黑名单,市场上领先的大数据风控公司拥有将近1000万左右的黑名单,大部分黑名单是过去十多年积累下来的老赖名单,真正有价值的黑名单在两百万左右。
黑名单来源于民间借贷、线上P2P、信用卡公司、小额借贷等公司的历史违约用户,其中很大一部分不再有借贷行为,参考价值有限。另外一个主要来源是催收公司,催收的成功率一般小于于30%(M3以上的),会产生很多黑名单。
灰名单是逾期但是还没有达到违约的客户(逾期少于3个月的客户),灰名单也还意味着多头借贷,申请人在多个贷款平台进行借贷。总借款数目远远超过其还款能力。
黑名单和灰名单是很好的风控方式,但是各个征信公司所拥有的名单仅仅是市场总量的一部分,很多互联网金融公司不得不接入多个风控公司,来获得更多的 黑名单来提高查得率。央行和上海经信委正在联合多家互联网金融公司建立统一的黑名单平台,但是很多互联网金融公司都不太愿意贡献自家的黑名单,这些黑名单 是用真金白银换来的教训。另外如果让外界知道了自家平台黑名单的数量,会影响其公司声誉,降低公司估值,并令投资者质疑其平台的风控水平。
利用移动设备数据识别欺诈
行为数据中一个比较特殊的就是移动设备数据反欺诈,公司可以利用移动设备的位置信息来验证客户提交的工作地和生活地是否真实,另外来可以根据设备安装的应用活跃来识别多头借贷风险。
欺诈用户一般会使用模拟器进行贷款申请,移动大数据可以识别出贷款人是否使用模拟器。欺诈用户也有一些典型特征,例如很多设备聚集在一个区域,一起 申请贷款。欺诈设备不安装生活和工具用App,仅仅安装和贷款有关的App,可能还安装了一些密码破译软件或者其他的恶意软件。
欺诈用户还有可能不停更换SIM卡和手机,利用SIM卡和手机绑定时间和频次可以识别出部分欺诈用户。另外欺诈用户也会购买一些已经淘汰的手机,其机器上面的操作系统已经过时很久,所安装的App版本都很旧。这些特征可以识别出一些欺诈用户。
利用消费记录来进行评分
大会数据风控除了可以识别出坏人,还可以评估贷款人的还款能力。过去传统金融依据借款人的收入来判断其还款能力,但是有些客户拥有工资以外的收入,例如投资收入、顾问咨询收入等。另外一些客户可能从父母、伴侣、朋友那里获得其他的财政支持,拥有较高的支付能力。
按照传统金融的做法,在家不工作照顾家庭的主妇可能还款能力较弱。无法给其提供贷款,但是其丈夫收入很高,家庭日常支出由其太太做主。这种情况,就需要消费数据来证明其还款能力了。
常用的消费记录由银行卡消费、电商购物、公共事业费记录、大宗商品消费等。还可以参考航空记录、手机话费、特殊会员消费等方式。例如头等舱乘坐次数,物业费高低、高尔夫球俱乐部消费,游艇俱乐部会员费用,奢侈品会员,豪车4S店消费记录等消费数据可以作为其信用评分重要参考。
互联网金融的主要客户是屌丝,其电商消费记录、旅游消费记录、以及加油消费记录都可以作为评估其信用的依据。有的互联金融公司专门从事个人电商消费数据分析,只要客户授权其登陆电商网站,其可以借助于工具将客户历史消费数据全部抓取并进行汇总和评分。
参考社会关系来评估信用情况
物以类聚,人与群分。一般情况下,信用好的人,他的朋友信用也很好。信用不好的人,他的朋友的信用分也很低,
参考借款人常联系的朋友信用评分可以评价借款人的信用情况,一般会采用经常打电话的朋友作为样本,评估经常联系的几个人(不超过6六个人)的信用评分,去掉一个最高分,去掉一个最低分,取其中的平均值来判断借款人的信用。这种方式挑战很大,只是依靠手机号码来判断个人信用可信度不高。一般仅仅用于反欺诈识别,利用其经常通话的手机号在黑名单库里面进行匹配,如果命中,则此申请人的风险较高,需要进一步进行调查。
参考借款人社会属性和行为来评估信用
参考过去互联网金融风控的经验发现,拥有伴侣和子女的借款人,其贷款违约率较低;年龄大的人比年龄低的人贷款违约率要高,其中50岁左右的贷款人违 约率最高,30岁左右的人违约率最低。贷款用于家庭消费和教育的贷款人,其贷款违约率低;声明月收入超过3万的人比声明月收入低于1万5千的人贷款违约率 高;贷款次数多的人,其贷款违约率低于第一次贷款的人。
经常不交公共事业费和物业费的人,其贷款违约率较高。经常换工作,收入不稳定的人贷款违约率较高。经常参加社会公益活动的人,成为各种组织会员的人,其贷款违约率低。经常更换手机号码的人贷款违约率比一直使用一个电话号码的人高很多。
午夜经常上网,很晚发微博,生活不规律,经常在各个城市跑的申请人,其带贷款违约率比其他人高30%。刻意隐瞒自己过去经历和联系方式,填写简单信 息的人,比信息填写丰富的人违约概率高20%。借款时间长的人比借款时间短短人,逾期和违约概率高20%左右。拥有汽车的贷款人比没有汽车的贷款人,贷款 违约率低10%左右。
利用司法信息评估风险
涉毒涉赌以及涉嫌治安处罚的人,其信用情况不是太好,特别是涉赌和涉毒人员,这些人是高风险人群,一旦获得贷款,其贷款用途不可控,贷款有可能不会得到偿还。
寻找这些涉毒涉赌的嫌疑人,可以利用当地的公安数据,但是难度较大。也可以采用移动设备的位置信息来进行一定程度的识别。如果设备经常在半夜出现在 赌博场所或赌博区域例如澳门,其申请人涉赌的风险就较高。另外中国有些特定的地区,当地的有一部分人群从事涉赌或涉赌行业,一旦申请人填写的居住地址或者 移动设备位置信息涉及这些区域,也要引起重视。涉赌和涉毒的人员工作一般也不太稳定或者没有固定工作收入,如果申请人经常换工作或者经常在某一个阶段没有 收入,这种情况需要引起重视。涉赌和涉毒的人活动规律比较特殊,经常半夜在外面活动,另外也经常住本地宾馆,这些信息都可以参考移动大数据进行识别。
总之,互联网金融的大数据风控采用了用户社会行为和社会属性数据,在一定程度上补充了传统风控数据维度不足的缺点,能够更加全面识别出欺诈客户,评价客户的风险水平。互联网金融企业通过分析申请人的社会行为数据来控制信用风险,将资金借给合格贷款人,保证资金的安全。
结语:以上就是首席CTO笔记为大家整理的关于金融大数据风控接入需要多少的相关内容解答汇总了,希望对您有所帮助!如果解决了您的问题欢迎分享给更多关注此问题的朋友喔~