Sentry 金融实时风控系统
梁堃@数美时代
目录
01 背景与挑战
02 Sentry实时风控系统
03 Q & A
背景与挑战
01
数美 发现数据之美
数美 金融大数据解决方案提供商
核心业务 为金融行业提供大数据产品及服务开发,并提供基于大数据场景的解决方案。主营产
品(业务)分为风险控制类、用户画像类、精准营销类、数据分析与挖掘类、数据仓库类、大数据
决策支撑类
我们是谁
背景与挑战
交易的种类越来越多
流水也越来越大
欺诈交易带来的
损失迅速增加银行业高速发展
实时风控系统对于银行业继续保持高速发展越来越重要
背景与挑战
目标
挑战
安心:实时阻断欺诈交易,减少客户/商家/银行的损失
便捷:让正常的交易便捷流畅地完成,减少不必要的中间环节
• 银行业务的内在复杂度
• 交易发生的方式、地点非常的多样化
• 欺诈方式、技术等的不断提高
• 两个目标似乎是矛盾的
背景与挑战
大数据
迎接挑战
美国的经验:平均每100美元交易中
由于欺诈导致的损失
1990~1992年:20分
2008~2010年:7分
02 Sentry金融实时风控系统
Sentry是什么
以大数据为核心
建立正常交易模型
识别欺诈交易
• 基于大数据技术构
建的实时交易风险
评估系统
Sentry是什么
业务系统将交易信息发
送风控系统
发现该交易中存在的
异常行为和可疑场
景
根据发现的“证据”
计算该交易的风险系数
将风险系数等相关信
息反馈给业务系统
在每一笔交易发生时,实时进行
异常行为
交易账号曾出现在POC中 交易频率异常
交易时间异常 交易地点异常
交易延时异常 交易序列异常
交易金额异常
异常行为
Ø 个性化信息,针对特定客户,
特定帐号
Ø 不是常用的或常常发生的情
况
Ø 不符合该客户,该帐号平常
的行为模式
主要类型
可疑场景
1. 可疑收款账号
2. 可疑收款商家
3. 可疑收款POS
4. 可疑交易ATM
5. 可疑交易地点
6. 可疑交易应用
7. …
可疑场景
Ø 全局信息
Ø 在该场景下经常发生欺诈交易
计算风险系数
计算交易的欺诈概率
• (0, 1)范围内的值
• “证据”越多,包含的“证据”越强,概率越大
• 常用技术
1. 规则系统
2. 机器学习
3. 机器学习与规则混合系统
• 计算交易风险系数
• 渠道特定
• 例如:欺诈概率,欺诈概率 x 交易金额
业务系统处理
030201
交易放行
04
附加验证
人工座席验证
交易阻断
Sentry的整体架构:主要模块图
access-layer
drpc-servers
sentry-sdk
prediction-engine
业务渠道
CH N
…
CH 2
CH 1
CH 3
rule-engine
ml-models
rt-statistics
…
rule-manager
report-manager
case-manager
dashboard (web-ui)
客户信息
客户行为历史
offline-mining
客户画像挖掘
POS画像挖掘
…
ml-training
NN	Train
GBDT	Train
…
profiles
客户画像
POS画像
…
Sentry的整体架构:主要数据流图
业务渠道
CH N
…
CH 2
CH 1
drpc-servers
sync	api
rule-engine
CH 3
ml-models
NN
GBDT
…
feature-
assembler
profiles
case-
manager
客户信息
客户行为历史
dashboard (web ui)
Online
Offline
offline-mining
客户画像挖掘
POS画像挖掘
…
ml-training
NN	Train
GBDT	Train
…
sentry-sdk
result-cacheresult-return
rt-statistics
async	api
async	api
sentry-inputs rule-manager
Sentry的特点
1.잠재 고객
多渠道
⾼可⽤
⾼可伸缩
低成本
低延时
• 几分之一秒的响应时间
• 运行于普通的PC服务器之上,对硬件没有特殊要求
• 随着PC服务器数目的增加,吞吐近乎可以等比例地增加
• 完全的分布式系统,少量PC服务器宕机不影响服务
• 支持同时接入多种业务渠道
• 支持跨渠道实时风险评估
Sentry使用的开源组件
• 分布式存储系统 Cassandra
• 在Sentry中主要用于存储画像、案例、规则等数据
• 支持快速的按key查询、更新,支持批量读取、写入
• 实时计算系统 Storm
• 在Sentry中是预测引擎使用的实时计算框架
• 支持毫秒级别的实时计算
• 分布式一致性协议的实现 ZooKeeper
Sentry的实施
3阶段:改进阶段
1 1.5 3
• 1阶段:基于规则的欺
诈交易识别
2阶段:基于机器学习
+ 规则的欺诈交易识别
2
1.5阶段:基于规则 + 数据挖掘
的欺诈交易识别
实施的三个阶段
前提
Sentry实施的第一阶段:基于规则的欺诈交易识别
阶段1.5: 通过数据挖掘获得规则中的阈值
• 例如上述规则中的 “5000”, “50000”
搭建实时风控系统架构
• 该阶段,机器学习引擎返回空常量
• 打通与渠道系统的交互流程
资深业务人员制定规则体系
• 转账金额 > 5000 AND IP属地 != 常用属地 è 附加验证
• 累计转账金额 > 50000 AND 收款方账号位于灰名单中 è 人工座席验证
• …
收集并准备必要的数据1
3
4
2
Sentry实施的第二阶段:基于机器学习 + 规则的欺诈交易识别
训练深度神经网络
• 实时在线训练
• 批量训练
启用机器学习引擎
• 随着训练样本和时长的增加,机器学习模
型会越来越准
逐步调整机器学习和规则相对比例
• 平滑过渡到机器学习为主、规则为辅的状
态
Sentry实施的第三阶段:长期改进阶段
B:引入更多维度的数据
• 为机器学习提供更多有信息量的特
征
C:调优机器学习模型
神经网络的结构
Regularization方法
调整训练参数
A:案例深入分析
03 Q & A
谢谢大家!
北京数美时代科技有限公司

More Related Content

PDF
BDTC2015 新浪微博-姜贵彬-大数据驱动下的微博社会化推荐
PPTX
Anti Credit Abuse & Acquisitions Seminar
PDF
BDTC2015 阿里巴巴-鄢志杰(智捷)-deep learning助力客服小二:数据技术及机器学习在客服中心的应用
PPTX
Capital One's Next Generation Decision in less than 2 ms
PDF
5. Apache Kylin的金融大数据应用场景 - Apache Kylin Meetup @Shanghai
PDF
Alibaba arch-jiangtao-qcon
PDF
AI Is Driving Financial Innovation
PDF
04_从支付公司到金融集团
BDTC2015 新浪微博-姜贵彬-大数据驱动下的微博社会化推荐
Anti Credit Abuse & Acquisitions Seminar
BDTC2015 阿里巴巴-鄢志杰(智捷)-deep learning助力客服小二:数据技术及机器学习在客服中心的应用
Capital One's Next Generation Decision in less than 2 ms
5. Apache Kylin的金融大数据应用场景 - Apache Kylin Meetup @Shanghai
Alibaba arch-jiangtao-qcon
AI Is Driving Financial Innovation
04_从支付公司到金融集团

Similar to BDTC2015 数美时代-梁堃-sentry 金融实时风控系统 (20)

PDF
2023年顶级战略技术趋势-Gartner.pdf
PDF
HITCON TALK 產業視野下的 InfoSec
PDF
銀行商業創新課程介紹 Pdf 2015-5_7
PDF
20200429_software
PDF
Big Data For CIO_大數據白皮書_2015
PDF
新時代的未來銷售和客戶體驗(IBM軟體部門總經理賈景光)
PDF
8-2大数据要素行业龙头bp.pdf大数据要素行业龙头大数据要素行业龙头大数据要素行业龙头
PPT
欧赛斯山丽网络整合营销提案
PDF
【MMdc 數位名人沙龍-領袖對談】社群商務實戰、趨勢與進化觀-數據洞察
PDF
【M mdc 數位名人沙龍 領袖對談】社群商務實戰、趨勢與進化觀-數據洞察
PPT
My house雲端社區服務平台營運計畫書(20131101)
PDF
维客旺Scrm
PDF
2025更新版:數位轉型本質三部曲 —數據驅動、商模創新、組織變革 - 20250111
PPT
機密圖檔與敏感資料庫資料防洩漏方案
PDF
金融反欺诈中,社交网络算法有用吗?
PDF
博晓通社会化大数据解决方案和公司介绍201406
PDF
2012年3月创业投资与并购报告 资本实验室
PDF
別忽略就在您身旁的數據 掌握商業價值 你用過Google Analytics這個分析工具嗎 網站分析成效優化分享版
PPT
第四小组 迪斯尼Crm报告
PDF
行政院會簡報:經濟部簡報:報一 中小微企業多元振興發展計畫-經濟部 懶人包.pdf
2023年顶级战略技术趋势-Gartner.pdf
HITCON TALK 產業視野下的 InfoSec
銀行商業創新課程介紹 Pdf 2015-5_7
20200429_software
Big Data For CIO_大數據白皮書_2015
新時代的未來銷售和客戶體驗(IBM軟體部門總經理賈景光)
8-2大数据要素行业龙头bp.pdf大数据要素行业龙头大数据要素行业龙头大数据要素行业龙头
欧赛斯山丽网络整合营销提案
【MMdc 數位名人沙龍-領袖對談】社群商務實戰、趨勢與進化觀-數據洞察
【M mdc 數位名人沙龍 領袖對談】社群商務實戰、趨勢與進化觀-數據洞察
My house雲端社區服務平台營運計畫書(20131101)
维客旺Scrm
2025更新版:數位轉型本質三部曲 —數據驅動、商模創新、組織變革 - 20250111
機密圖檔與敏感資料庫資料防洩漏方案
金融反欺诈中,社交网络算法有用吗?
博晓通社会化大数据解决方案和公司介绍201406
2012年3月创业投资与并购报告 资本实验室
別忽略就在您身旁的數據 掌握商業價值 你用過Google Analytics這個分析工具嗎 網站分析成效優化分享版
第四小组 迪斯尼Crm报告
行政院會簡報:經濟部簡報:報一 中小微企業多元振興發展計畫-經濟部 懶人包.pdf
Ad

More from Jerry Wen (8)

PDF
BDTC2015 阿里巴巴-郑斌-大数据下的数据安全
PDF
BDTC2015 南京大学-黄宜华-octopus(大章鱼):基于r语言的跨平台大数据机器学习与数据分析系统
PDF
BDTC2015-新加坡管理大学-朱飞达
PPTX
BDTC2015 小米-大数据和小米金融
PDF
BDTC2015 hulu-梁宇明-voidbox - docker on yarn
PDF
BDTC2015 京东-刘海锋-大规模内存数据库jimdb:从2014到2016
PDF
BDTC2015 databricks-辛湜-state of spark
PDF
BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告
BDTC2015 阿里巴巴-郑斌-大数据下的数据安全
BDTC2015 南京大学-黄宜华-octopus(大章鱼):基于r语言的跨平台大数据机器学习与数据分析系统
BDTC2015-新加坡管理大学-朱飞达
BDTC2015 小米-大数据和小米金融
BDTC2015 hulu-梁宇明-voidbox - docker on yarn
BDTC2015 京东-刘海锋-大规模内存数据库jimdb:从2014到2016
BDTC2015 databricks-辛湜-state of spark
BDTC2015 启明星辰-潘柱廷-中国大数据技术与产业发展报告
Ad

BDTC2015 数美时代-梁堃-sentry 金融实时风控系统