分享

中国科学院院士张钹:生成式时代的AI产业 ——迈向第三代人工智能

 skysun000001 2024-08-21 发布于云南

来源:中国计算机报

作者:本报编辑部

8月1日,第十二届互联网安全大会(ISC.AI 2024)人工智能峰会在北京召开,中国科学院院士、清华大学计算机系教授张钹受邀出席大会并发表了主题演讲,他深入剖析了人工智能产业的发展现状,并对未来的发展方向提出了独到见解。
图片
人工智能产业与信息科技产业的发展速度存在显著差异。信息科技产业得益于坚实的理论基础,如1936年建立的计算机理论、1948年建立的通讯和控制理论,这些理论的确立为通用硬件和软件的发展奠定了基石。由此催生了IBM、Intel、微软等一批行业巨头,推动了行业信息化的快速发展。相较之下,人工智能产业由于缺乏统一的理论体系,目前的发展仍然依赖于特定领域的模型和算法,这无疑限制了其市场规模和产业的快速发展。
张钹对人工智能的发展历程进行了深刻的回顾与总结。他将人工智能的发展分为三个阶段:第一代的知识驱动模型,这一阶段的人工智能主要依赖于知识、算法和算力三个要素;第二代的数据驱动模型,在第一代的基础上增加了数据作为核心要素,进一步推动了人工智能的发展。然而,这两代模型均受限于特定领域,未能实现真正的通用性,这也成为了人工智能产业发展的瓶颈;但随着基础模型的出现,人工智能产业站上了一个新的起点。基础模型以其强大的语言生成能力、人机自然交互能力和迁移学习能力,为人工智能的未来发展打开了新的大门。然而,这些强大能力也伴随着一个潜在的问题,即模型可能会产生的“幻觉”,即错误信息的输出,这也是迈向第三代人工智能时必须面对的挑战。

图片

基础模型的三大能力与一大缺陷


    图片   


基础模型的首要能力是其卓越的语言生成能力。这种能力在三个方面尤为突出:第一,基础模型能够处理开放领域的语言问题,与以往针对特定领域的模型形成鲜明对比;第二,它们能够生成多样化的结果,这种灵活性和创造性是以往模型不具备的;第三,这些模型生成的语言在语义上连贯,类似于人类的自然语言,使得人类能够轻松理解其输出并把握意图。
其次,基础模型展现出强大的人机自然交互能力。这一点在生成式人工智能时代尤为重要,因为它使人类能够在开放领域内与机器进行自然语言对话。这种交互能力曾被视为人工智能的终极目标,而如今,随着基础模型的发展,这一目标已经初步实现。
最后,基础模型具有显著的迁移学习能力,即它们能够在面对新任务时,通过少量样本或学习迅速适应并表现出色。这种能力使得基础模型能够在不同领域和任务之间灵活转换,极大地扩展了人工智能的应用范围。
然而,基础模型拥有强大能力的同时也带来了新的潜在问题。它们存在一个被称为“幻觉”的缺陷,即在追求输出多样性的同时,模型可能会生成错误或不准确的信息。这种错误是模型内在的、不可控的,且必然会发生。这种“幻觉”问题要求使用者在应用基础模型时必须谨慎,特别是在那些对错误容忍度较低的领域。

图片

大模型对产业发展的影响


    图片   


谈及大模型对人工智能产业发展的深远影响,张钹对大模型在不同应用场景中所面临的挑战进行了细致的分析。

(一)开发垂直领域的大模型

随着大模型技术的发展,未来将出现更多针对特定垂直领域的定制化模型。这些模型将深入金融、医疗、石油等专业领域,利用其强大的数据处理和分析能力,为这些行业提供更加精准和高效的解决方案。这种趋势不仅能够推动产业升级,也将为人工智能技术的商业应用开辟新的道路。

(二)提供通用或开源模型

大模型的另一个发展方向是成为通用或开源的基础设施。通过提供这样的平台,可以让更多的开发者和企业在这些模型的基础上进行创新和应用开发,从而加速人工智能技术的普及和应用。这种开放的模式有助于构建一个更加活跃和多元的技术生态系统,促进知识的共享和技术的迭代。

(三)结合其他技术开发新应用

通过与物联网、大数据、云计算等技术的融合,大模型能够开发出更多创新的应用,解决更加复杂的问题。这种跨领域的技术整合将推动人工智能技术向更深层次和更广领域的发展,为社会带来更加丰富的应用场景和价值。
大模型的应用将显著提高相关应用的效率和质量。通过利用大模型的强大能力,可以在很多场景下实现自动化和智能化,减少人为错误,提高决策的质量和速度。这种效率的提升,不仅能够为企业带来经济效益,也将为社会的发展带来积极的影响。

图片

大模型的发展方向


    图片   


在对大模型的当前状态进行了深入分析后,张钹提出了大模型未来发展的四个关键方向,这些方向预示着人工智能将迈向更高层次的发展阶段。
首先,张钹强调了大模型需要与人类对齐的重要性。这意味着大模型需要更好地理解和适应人类的思维方式和行为模式。通过在闭环系统中与人类互动,大模型能够在执行任务后接收人类的反馈,从而纠正错误并优化性能。这种与人类对齐的能力,将使大模型更加精准地服务于人类的需求,提高其在各种应用场景中的适用性和有效性。
其次,张钹提出了多模态生成的概念。这一方向强调了大模型在生成文本之外,还能够生成图像、声音、视频和代码等多种模态的数据。这种多模态生成能力将极大地扩展人工智能的应用范围,例如,在虚拟现实、增强现实和游戏设计等领域,提供更加丰富和真实的用户体验。同时,这也将推动人工智能在艺术创作、内容生产等领域的发展,创造出新的商业模式和市场机会。
第三,张钹提出了AI Agent或智能体的概念。智能体是具有一定自主性的AI系统,能够在虚拟或真实的环境中执行任务并学习改进。通过与环境的交互,智能体能够获得反馈,从而提高自身的决策能力和适应性。这一方向的发展将使人工智能更加智能化和自主化,为自动驾驶、机器人技术等领域带来革命性的进步。
最后,张钹展望了具身智能的发展前景。具身智能是指将智能系统与物理实体(如机器人)结合,使其能够在现实世界中进行感知、决策和行动。这种智能系统的硬件多样化将推动通用软件的发展,使人工智能能够更好地适应不同的应用场景和任务需求。具身智能的发展将为制造业、服务业和医疗保健等领域带来深远的影响。

图片

第三代人工智能的构建


    图片   


张钹特别强调,第三代人工智能的构建必须建立在坚实的理论基础之上。目前,尽管人工智能领域取得了显著的进展,但仍然缺乏一个统一的理论框架来解释和指导实践。理论的缺失导致了实践中的困惑和误解,也给技术的安全性和可靠性带来了隐患。因此,发展一套完善的理论体系,对于指导人工智能的健康发展至关重要。
在技术层面,张钹提出第三代人工智能应实现安全、可控、可信、可靠和可扩展的目标。这意味着人工智能系统不仅要在技术上达到高标准,还要在伦理、法律和社会层面得到充分的考量和保障。技术的安全性和可控性是确保人工智能正确服务于人类社会的前提;可信和可靠性则是赢得用户和社会信任的关键;而技术的可扩展性则是推动人工智能不断进步和应用的基础。
张钹还指出,第三代人工智能的发展需要重新利用知识、数据、算法和算力这四个核心要素。在当前以数据和算力为主导的人工智能发展模式中,知识的重要作用往往被忽视。张钹认为,知识是人工智能理解世界、作出决策的基础,而数据则是知识获取的源泉。算法作为实现智能行为的工具,需要不断地优化和创新。算力则是支撑算法运行和数据处理的基础。这四个要素的有机结合,将为人工智能的发展提供强大的动力。

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多