English中文
将人工智能用起来
2019年6月18-21日
北京,中国

PAI张量加速器和优化器:又一个深度学习编译器(PAI tensor accelerator and optimizer: Yet another deep learning compiler)

此演讲使用中文 (This will be presented in Chinese)

杨军 (阿里巴巴), 龙国平 (Alibaba)
14:5015:30 Friday, June 21, 2019

必要预备知识 (Prerequisite Knowledge)

* 对深度学习有一定的基础和了解; * 熟悉常用的深度学习引擎和框架; * 熟悉AI业务的落地闭环通路;

您将学到什么 (What you'll learn)

* 深度学习编译器的技术体系和执行路径; * 深度学习编译器技术在具体的AI业务里落地的实战经验; * 基于通用编译优化技术对于深度学习性能优化问题的原则提炼及总结。

描述 (Description)

本次议题会cover下述内容:

  • PAI-TAO的高层次设计理念及架构;
  • PAI-TAO的关键实现细节,包括编译器前端、中端及后端的关键技术难点。比如针对NV GPU硬件平台的后端Codegen的精细化kernel生成策略选取以及全局优化反馈通路的设计等;
  • 会对PAI-TAO里比较独特的技术点—-基于GPU片上共享内存的大尺度计算图融合策略进行比较详细的介绍和探讨,包括设计的motivation、实施效果以及benchmark number;
  • 会介绍PAI-TAO编译器与PAI团队其他优化技术的协同配合的技术体系,比如PAI团队一直在推进的auto-parallel以及GPU集群优化工作;
  • 最后会介绍PAI-TAO在阿里内部业务场景的落地效果,包括具体的性能number。
Photo of 杨军

杨军

阿里巴巴

目前在阿里巴巴计算平台事业部PAI团队负责大规模深度学习算法基础设施相关建设工作,对大规模分布式机器学习的开发、建设、优化以及在不同业务场景中的落地应用有较为深入的理解和认识。之前先后在奇虎360担当广告技术部门架构师,Yahoo北京研发中心担当效果广告系统技术负责人。

Photo of 龙国平

龙国平

Alibaba

目前在阿里巴巴PAI团队负责GPU底层核心优化工作,之前在中科院软件所从事计算机系统结构相关研究工作,对高性能计算、微处理器设计、异构计算领域有较深入的理解和认识,先后有多篇论文在PPoPP、Micro、ACL等体系结构及AI领域顶级会议发表。