English中文
PUT AI TO WORK
June 18-21, 2019
Beijing, CN

量化互联网金融信用与反欺诈风控 (Day 2)

此演讲使用中文 (This will be presented in Chinese)

09:0017:00 Wednesday, June 19, 2019
Location: 多功能厅2(Function Room 2)

必要预备知识 (Prerequisite Knowledge)

一些数据科学建模经验

您将学到什么 (What you'll learn)

1)了解数据科学在互联网金融领域里在个人信用评估的价值 2)了解个人信用领域真实的数据科学流程和考虑方面 3)了解信用模型搭建中多种挑战的解决方案

描述 (Description)

2天培训 (2-day training)

第一天 (上午):

金融信用行业概况

  • 什么是信用?
  • 信用贷款行业概况
  • 信用贷款风险
  • 金融产品的设计

数据特性与评估标准

  • 中美信用评分的现状
  • 信息源:身份鉴别+还款能力/意愿,个人设备信息,个人线上/线下行为信息
  • 风控术语与评估标准
  • 数据源获取挑战

数据采集与特征提取

  • 数据源的选择
    • 信贷金融属性强度,数据产生的频率,反应还款能力/意愿
  • 特征的挖掘
    • 特征的挖掘,有效性/稳定性的评估
    • 特征的组合,
    • 迁移学习,主动学习,表征学习

第一天(下午):

数据采集与特征提取

  • 知识图谱的应用
    • 实体和关系的定义
    • 图数据库的技术实现
    • 用Cypher做图谱挖掘
    • 社区挖掘算法案例
  • 设备指纹

信用和欺诈的标注

  • 标注获取的挑战
    • 成本高,周期长,定义多样
  • 信用标注
    • 早期产品模型,成熟产品模型
  • 欺诈标注
    • 欺诈标注的五层分层

信用和欺诈模型的搭建

  • Incremental learning
    • Static windowing approach
    • Updating approach
    • Forgetting genuine approach
  • 数据非平衡处理
    • Random oversampling and undersampling
    • Informed undersampling
    • Synthetic sampling with data generation
    • Adaptive synthetic sampling
    • Sampling with data cleaning techniques
  • 模型策略
    • Linear regression
    • GBT
    • Ensembles

第二天(上午):

黑色产业链

  • 黑色产业链一览
  • 安全与用户体验的权衡
  • 对应策略

用户模型、分类和欺诈检测

  • 用户模型特征工程
  • 大数据用户分析
  • 主动式机器学习的应用

图算法和信誉传播

  • 图算法在欺诈帐号检测中的应用
  • 基于图结构的随机行走
  • 基于图机构的信誉传播

第二天(下午):

行业案例

  • Deep learning 的应用

商业决策和评估

  • 结果评估
    • 混淆矩阵
    • 排序评估方法
    • ROC curve
    • PR curve
  • 模型评分alignment
  • 利率和额度的确定
  • 营利性的评估

实战练习

  • 计算KS,IV
  • 评估特征稳定性
  • 建模:GBR + stacking