Presented By O’Reilly and Intel AI
Put AI to work
April 10-11, 2018: Training
April 11-13, 2018: Tutorials & Conference
Beijing, CN

In-Person Training
人工智能和金融科技:量化金融信用与欺诈风险的评估

Jike Chong (Tsinghua University | Acorns), 黄铃 (Tsinghua University), Zoe Chen (eCreditPal.com)
Tuesday, April 10 & Wednesday, April 11, 09:00 - 17:00
与人工智能交互 (Interacting with AI), 实施人工智能 (Implementing AI)
Location: 多功能厅3A+B(Function Room 3A+B) Level: Intermediate

Participants should plan to attend both days of this 2-day training course. Platinum and Training passes do not include access to tutorials on Wednesday.

您想了解金融企业是怎样利用大数据和人工智能技术来画像个人行为并检测欺诈用户的吗?互联网金融幕后的量化分析流程是怎么杨的?个人信用是怎样通过大数据被量化的?在实践过程中,机器学习算法的应用存在着哪些需要关注的方面?怎样通过图谱分析来融合多维数据,为我们区分正常用户和欺诈用户? 这套辅导课基于清华大学交叉信息研究院2017年春天新开设的一门"量化金融信用与风控分析”研究生课。其中会用LendingClub的真实借贷数据做为案例,解说一些具体模型的实现。

您想了解金融企业是怎样利用大数据和人工智能技术来画像个人行为并检测欺诈用户的吗?互联网金融幕后的量化分析流程是怎么杨的?个人信用是怎样通过大数据被量化的?在实践过程中,机器学习算法的应用存在着哪些需要关注的方面?怎样通过图谱分析来融合多维数据,为我们区分正常用户和欺诈用户? 这套辅导课基于清华大学交叉信息研究院2017年春天新开设的一门"量化金融信用与风控分析”研究生课。其中会用LendingClub的真实借贷数据做为案例,解说一些具体模型的实现。

第一天 (上午):

1. 金融信用行业概况

  • 什么是信用?
  • 信用贷款行业概况
  • 信用贷款风险
  • 金融产品的设计

2. 数据特性与评估标准

  • 中美信用评分的现状
  • 信息源:身份鉴别+还款能力/意愿,个人设备信息,个人线上/线下行为信息
  • 风控术语与评估标准
  • 数据源获取挑战

第一天(下午):

3. 数据采集与特征提取

  • 数据源的选择
    - 信贷金融属性强度,数据产生的频率,反应还款能力/意愿
  • 特征的挖掘
    - 特征的挖掘,有效性/稳定性的评估
    - 特征的组合,
    - 迁移学习,主动学习,表征学习
  • 知识图谱的应用
    - 实体和关系的定义
    - 图数据库的技术实现
    - 用Cypher做图谱挖掘
    - 社区挖掘算法案例
  • 设备指纹

4. 信用和欺诈的标注

  • 标注获取的挑战
    -成本高,周期长,定义多样
  • 信用标注
    -早期产品模型,成熟产品模型
  • 欺诈标注
    -欺诈标注的五层分层

第二天(上午):

5. 信用和欺诈模型的搭建

  • Incremental learning
    - Static windowing approach
    - Updating approach
    - Forgetting genuine approach
  • 数据非平衡处理:
    - Random oversampling and undersampling
    - Informed undersampling
    - Synthetic sampling with data generation
    - Adaptive synthetic sampling
    - Sampling with data cleaning techniques
  • 模型策略
    - Linear regression
    GBT
    - Deep learning
    - Ensembles
  • 结果评估
    - 混淆矩阵
    - 排序评估方法
    ROC curve
    - PR curve

6. 商业决策和评估:

  • 利率和额度的确定
  • 营利性的评估

7. 行业案例

第二天(下午):

8. 黑色产业链

  • 黑色产业链一览
  • 安全与用户体验的权衡
  • 对应策略

9. 用户模型、分类和欺诈检测

  • 用户模型特征工程
  • 大数据用户分析
  • 主动式机器学习的应用

10. 图算法和信誉传播

  • 图算法在欺诈帐号检测中的应用
  • 基于图结构的随机行走
  • 基于图机构的信誉传播

About your instructors

Photo of Jike Chong

种骥科博士,清华兼职教授,现任美国Acorns首席数据科学家. 之前,种骥科曾任职于宜人贷 (NYSE:YRD) 首席数据科学家,负责反欺诈风控和数字驱动的运营和创新。再之前,种骥科曾任职于美国Simply Hired招聘平台,创建了数据科学部, 并应邀为白宫科技办公室参谋大数据技术产品设计。还曾就职于美国Silver Lake 私募公司任Kraftwerk基金数据科学架构师,负责大数据技术在私募投资风控方面的应用。种骥科曾任美国卡内基梅隆大学教授与博士生导师,持有加州大学伯克利分校电子工程和计算机科学系博士学位,卡内基梅隆大学电子和计算机工程系硕士及本科学位,和9项美国专利(5项获准,4项待批)。

Photo of 黄铃

黄铃,慧安金科(北京)科技有限公司创始人、CEO,清华大学交叉信息研究院兼职教授。主要技术背景是人工智能、信息安全和金融风控。他是全球为数不多的同时精通人工智能和计算机安全的顶级专家,在美国加州大学伯克利分校获得计算机科学博士 (2002-2007),师从 Anthony Joseph 和 Michael Jordan ,从事机器学习算法研究以及计算机网络建模应用。他是美国硅谷著名的反欺诈公司DataVisor的创始成员和大数据总监 (2014-1016),主持了公司整个机器学习,用户行为分析和信用分析系统。他在美国英特尔研究院任资深科学家七年(2007-2014),和 Intel McAfee 开展多个合作项目,应用人工智能技术解决网络和数据安全问题。他在人工智能,大数据分析和金融科技相关领域有近十五年的研究和开发背景,在世界顶尖会议上发表近50篇论文,在 Google Scholar 上总引用已超过5,000次。

Photo of Zoe Chen

陈薇博士,现任排列科技首席运营官,江西互联网金融协会特聘风控专家,博金贷金融科技研究院院长。
之前,陈薇曾任职于Lendingclub (NYSE:LC) 任首席数据科学家,负责风险管理相关技术创新,开创性将机器学习与文本数据挖掘系统引入P2P贷款风险分析,取得非常良好的效果,并极大缩短了研发周期,主导的非传统风险模型与决策算法的研究与开发,使公司风控水准远高于美国传统银行。再之前,陈薇曾任Paypal(NYSE:PYPL)主任信贷分析师,专注线上交易风险识别和分析,尤其是银行交易的风险分析和建模设计,创新性将大数据,人工智能和机器学习运用于风险识别和决策。持有内布拉斯加大学计算机科学系博士学位,清华大学计算机工程系硕士及中国人工智能重点实验室成员,曾担任数个学术期刊评审,发表专业论文数十篇。

会议注册

Get the Platinum pass or the Training pass to add this course to your package.