出家如初,成佛有余

互联网金融产品如何利用大数据做风控?

Posted in 电子商务 by chuanliang on 2015/04/06

我在知乎就问题《互联网金融产品如何利用大数据做风控?》做的回答。

由于互联网金融涉及货币发行(比特币)、第三方支付、投资理财(网络银行、保险、基金、证券、财富管理)、信贷(P2P、众筹、网络微贷)、征信等等,各个领域的风控策略并不尽相同,不能一概而论,下面讨论只能涵盖了常见的风控策略。
个人认为“大数据”除了强调数据的海量外,更重要的在于用于风控的历史数据的广度和深度,其中:
数据的广度:指用于风控的数据源多样化,任何互联网金融企业并不能指望依据单一的海量数据就解决风控问题,正如在传统金融风控中强调的“交叉验证”的原则一样,应当通过多样化的数据来交叉验证风险模型。以下的风控策略也如此,可能对同一风险事件采用了多种策略。
数据的深度:指用于风控的数据应当基于某个垂直领域真实业务场景及过程完整记录,从而保证数据能够还原真实的业务过程逻辑。
一个关于数据深度典型的反例:第三方支付貌似有丰富的真实交易记录,但由于大部分场景下无法获取交易商品的详细信息及用户身份,在用于风控时候价值大打折扣。

 

回到题主的话题:互联网金融产品如何利用大数据做风控。大致有如下一些常见方法:
1、基于某类特定目标人群、特定行业、商圈等做风控
由于针对特定人员、行业、商圈等垂直目标做深耕,较为容易建立对应的风险点及风控策略。
例如:
针对大学生的消费贷,主要针对大学生人群的特征
针对农业机具行业的融资担保。
针对批发市场商圈的信贷。

2、基于自有平台身份数据、历史交易数据、支付数据、信用数据、行为数据、黑名单/白名单等数据做风控
身份数据:实名认证信息(姓名、身份证号、手机号、银行卡、单位、职位)、行业、家庭住址、单位地址、关系圈等等。
交易数据/支付数据:例如B2C/B2B/C2C电商平台的交易数据,P2P平台的借款、投资的交易数据等。
信用数据:例如P2P平台借款、还款等行为累积形成的信用数据,电商平台根据交易行为形成的信用数据及信用分(京东白条、支付宝花呗),SNS平台的信用数据。
行为数据:例如电商的购买行为、互动行为、实名认证行为(例如类似新浪微博单位认证及好友认证)、修改资料(例如修改家庭及单位住址,通过更换频率来确认职业稳定性)。
黑名单/白名单:信用卡黑名单、账户白名单等。

3、基于第三方平台服务及数据做风控
互联网征信平台(非人行征信)、行业联盟共享数据(例如小贷联盟、P2P联盟) FICO服务
Retail Decisions(ReD)、Maxmind服务
IP地址库、代理服务器、盗卡/伪卡数据库、恶意网址库等
舆情监控及趋势、口碑服务。诸如宏观政策、行业趋势及个体案例的分析等等

4、基于传统行业数据做风控
人行征信、工商、税务、房管、法院、公安、金融机构、车管所、电信、公共事业(水电煤)等传统行业数据。

5、线下实地尽职调查数据
包括自建风控团队做线下尽职调查模式以及与小贷公司、典当、第三方信用管理公司等传统线下企业合作做风控的模式。
虽然貌似与大数据无关,但线下风控数据也是大数据风控的重要数据来源和手段。

知乎原文回答链接:http://www.zhihu.com/question/27715270/answer/43411182

Advertisements

交易系统和风控系统的架构怎么设计?

Posted in 电子商务, 技术相关, 产品管理 by chuanliang on 2015/01/19

我在知乎就《交易系统和风控系统的架构怎么设计?》做的回答。

交易系统和风控系统从架构角度设计,是应该设计成两个单独的系统,题主提到的问题,本质在于交易系统和风控系统之间数据共享及服务调用的问题。
一般通过如下几个层面来降低交易系统、风控系统的耦合度,提升系统性能和扩展性:读写分离、缓存/内存数据库、SOA架构、复合事件处理
数据库读写分离机制:在初期,风控系统一般都极为简单,此时侯一般通过数据库主从复制/读写分离/Sharding等机制来保证交易系统的数据库和风控系统数据的同步及读写分离。风控系统对所需要的客户/账户数据、交易数据一般都只进行读操作。
缓存/内存数据库机制:不 管是交易系统还是风控系统,高效的缓存系统是提升性能的大杀器,一般会把频繁使用的数据存放到Redis等缓存系统中。例如对风控系统,包括诸如风控规 则、风控案例库、中间结果集、黑白名单、预处理结果等数据;对交易系统而言,包括诸如交易参数、计费模板、清结算规则、分润规则、银行路由策略等。对一些 高频交易中,基于性能考虑,会采用内存数据库(一般会结合SSD硬盘)。
RPC/SOA架构:要降低交易系统和风控系统的 耦合度,在初期系统服务较少的情况下,一般直接采用RabbitMQ/ActiveMQ之类的消息中间件或RPC方式来实现系统间服务的调用。如果系统服 务较多,存在服务治理问题,会采用Dubbo之类的SOA中间件来实现系统服务调用。
复合事件处理(CEP):对实时/准实时交易风险控制,相对于纯基于规则的处理模式,采用复合事件处理(CEP)模式,性能及扩展性更好,开源的方案包括Esper、Storm、Spark等。
从风控系统构建角度,对应所谓的事前、事中、事后风险控制,作为风控系统最核心的风控引擎分为实时风控引擎、准实时风控引擎、定时风控引擎三种:
1、实时风控引擎&准实时风控引擎
实时风控主要在交易过程对交易过程进行实时监控,一个典型应用场景是甄别钓鱼、盗卡风险。
准实时风控典型应用场景是在T+1结算时候,对商户洗钱、跑路进行甄别。
实时/准实时风控引擎一般采用规则引擎+复杂事件处理(CEP)。
2、定时风控引擎
主要定时对支付/交易/账务等数据进行定时ETL、深度挖掘等处理,建立对应的风控模型,一个典型应用场景是商户的信用等级模型。此时侯一般采用Hadoop、ML等技术进行大数据建模
以前写过两篇关于第三方支付风控系统建设的文章,供参考
支付系统风控系统建设思考
复杂事件处理(Complex Event Processing)入门1

 

知乎回答原文链接:http://www.zhihu.com/question/20860347/answer/36328342