毫无疑问,人工智能被公认为是人类有史以来最伟大的一次革命,远超认知革命、农业革命和工业革命。当国内把人工智能概念炒得热火朝天的时候,美国硅谷的科技精英们已经在把更尖端的“黑科技”应用于商业领域。 让我们深入介绍2017年硅谷最火热的一项人工智能“黑科技”——GANs对抗网络。 GANs对抗网络是由蒙特利尔大学人工智能教授在两年前提出的概念,并逐渐引起AI业内人士的注意,直到2016年,生成对抗网络才在科技学术界和行业内出现“井喷”。多篇重磅论文陆续发表,AI巨头如Google、微软、Facebook等开始对其进行深入研究,“GANs之父”被公推为人工智能的顶级专家,GANs被称为“20年来机器学习领域最酷的想法”。 为什么这个曾经“不温不火“的”黑科技“可以一夜之间闻名人工智能业界呢?我们来看一看GANs的定义,以及它带来的价值。 GANs是什么? GANs发明者Ian Goodfellow给出的定义是这样的:“生成对抗网络是一种生成模型(Generative Model),其背后基本思想是从训练库里获取很多训练样本,从而学习这些训练案例生成的概率分布。而实现的方法,是让两个网络‘玩一个相互竞争的游戏’。其中一个叫做生成器网络(Generator Network),它不断捕捉训练库里真实图片的概率分布,将输入的随机噪声(Random Noise)转变成新的样本(也就是假数据)。另一个叫做判别器网络(Discriminator Network),它可以同时观察真实和假造的数据,判断这个数据到底是不是真的。生成模型要将模糊的低分辨率图像作为输入,并输出一个高分辨率的清晰图像。而判别模型,就要判断所输入的图像究竟是“真实高分辨率图像”还是由低分辨率图像“转化来的高分辨率图像”。而这就大大简化了图像超分辨率模型的学习过程。简单的来说sGANs的基本原理是它有两个模型:一个生成器,一个判别器。判别器的任务是判断给定图像是否看起来‘自然’,换句话说,是否像是人为(机器)生成的。而生成器的任务是,顾名思义,生成看起来‘自然’的图像,要求与原始数据分布尽可能一致。 GANs的运作方式可被看作是两名玩家之间的零和游戏。原论文的类比是,生成器就像一支造假币的团伙,试图用假币蒙混过关。而判别器就像是警察,目标是检查出假币。生成器想要骗过判别器,判别器想要不上当。当两组模型不断训练,生成器不断生成新的结果进行尝试,它们的能力互相提高,直到生成器生成的人造样本看起来与原始样本没有区别。 GANs的价值 GANs无监督学习的一种。无监督学习相比于有监督学习,虽然训练效果可能更差一些,但是无监督学习需要的数据标注(label)相对较少,能够从海量的无标注数据中学认知这个真实的世界,从而更好地理解这个的真实世界。GANs相比无监督学习的其他模型具有更高的价值。传统的无监督学习算法存在两大难以解决的问题,其一是要求运用大量的已知知识对真实世界进行建模,而建模的好坏将直接影响生成模型的表现;其二是真实世界的数据往往很复杂,使用无监督学习拟合模型的方式计算量非常庞大,甚至难以承受。而在GANs对抗网络中由于判别器的存在,生成器不再需要对于真实数据的先验知识和复杂建模,也能学习去逼近真实数据,最终让其生成的数据达到以假乱真的地步。 GANs为什么重要? GANs是更好的生成模型,在某种意义上避免了马尔科夫链式的学习机制,这使得它能够区别于传统的概率生成模型。传统概率生成模型一般都需要进行马可夫链式的采样和推断,而GANs避免了这个计算复杂度特别高的过程,直接进行采样和推断,从而提高了GANs的应用效率,所以其实际应用场景也就更为广泛。 其中GANs是一个非常灵活的设计框架,各种类型的损失函数都可以整合到GANs模型当中,这样使得针对不同的任务,我们可以设计不同类型的损失函数,都会在GANs的框架下进行学习和优化。 其次,最重要的一点是,当概率密度不可计算的时候,传统依赖于数据自然性解释的一些生成模型就不可以在上面进行学习和应用。但是GANs在这种情况下依然可以使用,这是因为GANs引入了一个非常聪明的内部对抗的训练机制,可以逼近一些不是很容易计算的目标函数。Facebook人工智能研究院的Yann LeCun也一直是GANs的积极倡导者。其中一个最重要的原因就是GANs为无监督学习提供了一个强有力的算法框架,而无监督学习被广泛认为是通往人工智能重要的一环。 GANs的影响 GANs还受到工业界的广泛关注。有许多做人工智能研究的公司正在投入大量的精力来发展和推广GANs模型。其中IanGoodfellow 如今所在的 OpenAI 公司。这个公司一直在致力于研究推广GANs,并将其应用在不同的任务上。同时 Facebook 和 Twitter 最近两年也投入了大量的精力来研究,并将GANs应用在了图像生成和视频生成上。尤其值得一提的是,Apple最近发表了其关于人工智能研究的首篇论文,恰恰是应用GANs来做数据的生成,帮助更好地训练机器学习模型。 2017年最火热的GANs(对抗网络)是一种生成模型,其背后的基本思想是利用一个生成器不断生成新样本数据,再借助一个判别器检验生成的数据是否“逼真“,最终产生接近于真实的样本数据。 通过这样的方式,GANs能够解决人工智能训练过程中样本量不足的问题,让智能计算机即使在样本量不足的情况下,能更好地理解我们的真实世界。“它”为创建无监督学习模型提供了强有力的算法框架,有望帮助我们为AI加入常识(common sense)。我们认为,沿着这条路走下去,有不小的成功机会能开发出更智慧的AI。 注:图文来自于网络,如若侵权,请联系删除 |
|