CHINESE  INSTITUTE  OF  COMMAND  AND  CONTROL

人工智能与数学

发表时间:2020-06-09 13:13来源:数据科学人工智能
1

1.jpg

以图像识别为例描述AI的任务,可以用一个函数来表示识别系统的AI。它的输入是图像,输出是识别的结果(例如规定猫为1,狗为0)。当输入图片为猫时,输出为1;当输入图片为狗时,输出0。

那怎样找到这样的一个函数呢?我们需要对函数进行某种参数化,通过算法去拟合这些参数,使得在现有数据上让机器识别猫为1,识别狗为0。

这样参数化的模型是可以用神经网络来表示。虽然其形式复杂,但在真实的场景下其实际性能表现非常好。

从数学上来讲,现在人工智能比较标志性的技术是深度学习。可以用最优控制的语言,或者用微分方程的语言来描述、刻画、分析模型和算法。这些模型和算法所涉及到很多数学问题。比如逼近理论,实际上是为了分析深度学习或者人工智能系统到底不能干哪些事情。再比如控制理论和优化理论,是为了解决能不能训练出一个模型的问题,使得AI在一个具体任务上更接近人的表现。除此之外,人工智能中的数学还包括微分方程、概率统计等等。

在图像感知中存在非常多的挑战,比如幻觉。在下面左边的图中,有A和B两个方格。人眼看起来好像A的颜色比B的颜色要深一些。实际上,如果把周围挡住,直接观察像素的灰度值,A和B的值是一样的。其实是幻觉让我们感觉A比B要暗一些。那么怎么从数学上去刻画它呢?

奥尔德森方格阴影错觉

有一个非常著名的数学家叫David Mumford,他在1974年获得了数学界的最高奖项菲尔兹奖(相当于数学界的诺贝尔奖)。他在世界数学家大会做一小时报告的时候,专门讲了怎么用数学来描述感知(perception)。


图像感知中的另外一个挑战,称为小样本学习。我们这里举个例子来说明什么是小样本学习。我们来做一个关于Steampunk的测试(来源于Rodney Brooks),首先下面的两幅图都是Steampunk:

下面我们来做测试,下面的图是不是Steampunk呢?

这些图都不是Steampunk

那这些图是不是Steampunk呢?

这些图都是Steampunk

Steampunk的中文名称叫蒸汽朋克,其实就是一种穿衣风格。这就是一个小样本学习的例子。给大家两个样本去学习,告诉你它的标签是Steampunk。之后给出的所有的图全部都是测试集。

刚才大家成功地进行了小样本学习。我也给我六岁的儿子做过同样的测试,他的识别准确率也是百分之百但是对于我们人类来说很容易的任务,对于现代的人工智能来讲,经常会出现很多问题。

小样本学习在机器学习里是一个非常重要也非常严峻的挑战。在很多科学领域(如医疗),样本通常并不是非常多。人类在做识别的时候,并不是基于大样本的,而是基于相对比较小的样本。

怎么让现在的人工智能算法能够基于很少的样本做出准确的识别呢?现在有大量的研究工作,基本上是在数据、模型和算法三个层面引入先验知识,这需要使用大量数学工具。