Presented By O’Reilly and Intel AI
Put AI to work
April 10-11, 2018: Training
April 11-13, 2018: Tutorials & Conference
Beijing, CN

为什么图模型对人工智能应用至关重要?

此演讲使用中文 (This will be presented in Chinese)

Mingxi Wu (Tigergraph inc), Yu Xu (TigerGraph)
13:1013:50 Thursday, April 12, 2018
Secondary topics:  AI应用的硬件、软件栈(Hardware and Software stack for AI applications)

必要预备知识 (Prerequisite Knowledge)

机器学习的基本概念。图模型。SQL。

您将学到什么 (What you'll learn)

图模型是一个很好的人工智能基础设施,由于实体之间的关系信息很好,允许一个人进一步推断间接事实和知识。

描述 (Description)

人工智能是由更多的数据和更多的计算资源驱动的。为了使机器像人一样思考,正确地组织数据的模型对于使用数据进行智能推理至关重要。在这次演讲中,我们将首先讨论人工智能数据管理的需求。其次,基于这些需求,我们指出了在人工智能中图形模型的独特优势,并讨论了一些已经用于生产的人工智能应用程序如何使用图模型来取得成功。

人工智能数据管理面临着以下挑战。

  • 许多人工智能应用需要大数据。机器只能消化数据才能使自己变得更聪明。大数据是机器智能化的原材料。因此,人工智能系统的数据管理部分必须是可伸缩的。
  • 一旦部署完毕,许多人工智能应用程序都需要实时响应。人类的交互或决策几乎是实时的(比如聊天机器人),或者在一个时间限制内做出响应,比如Alpha Go。因此,人工智能系统中的数据管理组件应该能够实时或接近实时查询大数据。
  • 人工智能应用程序数据管理的第三个要求是它必须支持可更新数据的管理。这一要求将帮助人工智能应用程序使用最新鲜的数据,就像人类的眼睛、耳朵、鼻子和身体接触一样,不断接收新数据,并通过神经将这些数据反馈给大脑。
  • 最后一个也是最重要的一点是,人工智能的数据管理平台应该支持深度链接分析能力。为了让机器像人类一样思考,它必须能根据数据连接做出推理,有时需要3步以上。 就像人类神经元通过一个神经网络发送信息,深度和高效。

面对以上的数据管理挑战,我们将讨论为什么图模型非常适合这个领域,并结合具体例子进一步深入讨论一些已经部署到影响人们日常生活的人工智能应用程序。具体地说,它们是

  • 问题回答(QA)系统。日益普遍的虚拟助手工具,如Alexa,Cortana,谷歌助手,和Siri, 问答系统更接近于人的日常生活。最近的一项研究利用知识图谱,为人们常问的一些非琐碎的问题进行多步推理。例如,一个2步的查询(演员到电影再到演员)可以是“谁与乔尔·埃文斯合作?”,一个3步的查询(电影到电影再到语言)可能是“由布雷得主演的电影里说的语言是什么?” 我们将用知识图谱来讨论问答系统的最新进展。
  • 智能电子邮件回复。Gmail已经成功地提供了一个智能回复功能。在用户阅读电子邮件后,它会提示用户选择回复邮件的短消息。没有打字,在候选信息按钮上的一个点击改善了发送者和接收者的体验。底层技术是基于图的半监督学习技术。我们将讨论图如何帮助在学习阶段整合和传播知识。
  • 检测电话诈骗是一种非平衡、时间敏感的分类问题。由于种种原因,这个问题很难解决。1)时间敏感。诈骗呼叫者可以在电话网络中潜伏很长一段时间,然后才发动攻击,或者诈骗电话只使用一次,然后立即丢弃。2)异构骗局模式。诈骗电话模式每一个都可能是独一无二的。如果没有深链分析,就很难发现异常行为。我们将讨论如何成功地设计一个基于图模型的实时电话诈骗探测器,保护数百万人免受欺诈电话。随着数据的发展,这个智能检测器可以不断地学习和适应新的诈骗模式。

通过深入讨论上述三种人工智能应用程序,我们的目标是激励更多的人工智能从业者利用图模型使机器更智能。

Photo of Mingxi Wu

Mingxi Wu

Tigergraph inc

Mingxi Wu is the vice president of engineering at TigerGraph, a Silicon Valley startup that is building a world-leading real-time graph data platform. Over the past 15 years, Mingxi has been focusing on database research and data management software building, serving within Microsoft’s SQL Server Group and Oracle’s Relational Database Optimizer Group. He has won research awards from the most prestigious publication venues in database and data mining (SIGMOD, KDD, and VLDB). He holds five US patents on big data and three pending international patents on graph management. He’s currently working on an easy-to-use and highly expressive graph query language. Mingxi holds a PhD from the University of Florida, where he specialized in both databases and data mining.

Photo of Yu Xu

Yu Xu

TigerGraph

Yu Xu is the founder and CEO of TigerGraph, the world’s first native parallel graph database. He is an expert in big data and parallel database systems and has over 26 patents in parallel data management and optimization. Previously, Yu worked on Twitter’s data infrastructure for massive data analytics and was Teradata’s Hadoop architect leading the company’s big data initiatives. Yu holds a PhD in computer science and engineering from the University of California, San Diego.