分享

从元数据到 AI 代理:Gartner2025 D&A峰会亮点问题

 数据治理精英馆 2025-04-03 发布于浙江

你现在正坐在办公桌前,不是吗?当你浏览信息时,你的眉头微微皱起,想知道自己是否错过了似乎每天都会发布的大量 AI 公告中的重要信息。

您总有一种感觉:当您还在为数据质量问题而苦苦挣扎时,您的竞争对手可能正在以某种方式在某个地方找到大规模实施人工智能的秘诀。

实际上,你并不孤单。Gartner 2025 数据与分析峰会证明了,这对于当今的数据领导者来说是一种多么普遍的经历。

对于试图驾驭行业历史上最具变革性的时期的数据领导者来说,今年的峰会既是治疗会议,也是警钟和路线图。

因此,让我们探索今年 Gartner数据和分析峰会的关键见解,因为这些见解可能会影响您 2025 年及以后的数据和 AI 战略。

“你还好吗?”:震撼人心的开场演讲

Gartner 副总裁分析师Gareth Herschel和Carlie Idoine在会议开始时提出了一个令人惊讶的富有同情心的问题:“你还好吗?”

房间里顿时一片寂静。他们感受到了数据领导者们对“人工智能海啸”袭击其业务的集体焦虑。

主题演讲“在您的 AI 旅程中扩展数据和分析”承认了许多CDO 和数据领导者面临的完美风暴:高数据和分析的期望、分散的 AI 试点,以及提供一致执行而不仅仅是更多实验的越来越大的压力。

他们分享的统计数据清晰地描绘了这一共同挑战:

  • 50% 的首席执行官相信人工智能将在未来三年内改变他们的行业,但数据可用性和质量仍然是实施的最大障碍。
  • 49% 的组织报告称,展示人工智能的价值是其采用人工智能的最大障碍。
  • 54% 的公司表示,他们目前CDO首先考虑数据分析和AI应用。
  • 超过一半的组织在数据质量和准备方面存在严重问题
  • “企业不了解数据和分析”仍然是数据和分析领导者面临的三大挑战之一
  • 数据质量是数据与分析领导者的首要风险责任

最让我印象深刻的是,数据文化是分析成功的主要障碍。当只有五分之一的组织始终将数据用于 AI 用例时,很明显,人们需要的是能够表达他们语言的数据,而不是更多关于如何表达“数据”的培训。

人工智能成功的三个平行旅程

演讲者阐述了成功组织正在同时经历的三段平行旅程:

  1. 业务成果之旅
    (信任=价值)
  2. 数据与分析能力之旅
    (适应性 = 规模)
  3. 行为改变之旅
    (人=转变)

通过值得信赖的自助分析以自然的商业语言向人们提供数据,而不是强制人们掌握技术知识。会议还强调了将被动元数据转变为主动元数据。因为这种转变正是实现值得信赖的自助式分析的关键——业务用户可以方便地获取见解,而无需技术专业知识。这让我想到了下一个亮点。

Mark Beyer 的主动元数据革命

第二天,马克·拜尔发表了堪称会议“摇滚明星”的演讲。他关于元数据管理的演讲引发了全场的集体共鸣。

他向观众发起挑战: “不要再抱怨你没有足够的元数据——你已经有足够的元数据了,只是你不使用它。”

传统的被动元数据处理方法,即那些尘封的数据字典和静态目录,从根本上来说存在缺陷。结构化数据和非结构化数据之间的隔阂完全是人为的,而主动元数据技术可以连接这两个世界。事实上,主动元数据是将您从技术堆栈带入信任堆栈的秘密要素。

他提供的统计数据令人大开眼界:

  • 70% 的组织仍然陷于基本的、被动的元数据清查
  • 仅有 12% 实施了主动元数据分析
  • 64% 的人使用元数据治理解决方案,但很少有人真正采用人工智能治理

不要再称之为“关于数据的数据”

元数据不仅仅是“关于数据的数据”。它是企业的完整神经系统,捕捉数十亿个可观察点,揭示组织实际运作方式。一份业务报告中的元数据包含的上下文丰富程度比大多数公司一个月内手动编录的内容还要多。从分发列表到情绪分析再到使用模式。

凭借人工智能取胜的公司并不是那些拥有更多数据的公司。而是那些将被动元数据目录转化为活生生的智能系统,实时显示其组织如何运作和使用数据的真实背景的公司。

对于那些创建人工智能企业的人来说,这个信息再明确不过了:

通往值得信赖、可投入生产的代理 AI 的道路不是通过更多的提示性技巧或微调。而是通过语义基础,让 AI 真正智能化。

通过主动元数据管理,生成的语义结构 (GSF) 可以了解组织如何使用数据(无需直接接触数据),自动映射、协调语义并添加人类背景,从而最大限度地提高 AI 投资回报。它不断自动地将被动信息转化为主动智能系统,使值得信赖、固有受控的 AI 成为现实。

AI 代理现实检查和Iron Man蓝图

如果 Beyer 的演讲是一个警钟,那么Ben Yan关于人工智能代理的演讲则描绘了我们前进的方向——而且比大多数人意识到的要快。

Yan 将理想的 AI 实现与 Tony Stark 和 JARVIS 进行了比较,强调真正的 AI 价值来自增强,而不是替代。这是关于Iron Man和JARVIS 的合作,而不是 JARVIS 单独行动。

他概述了人工智能系统如何从当前需要强力监督的模型演变为具有以下特征的未来系统:

  • 自主操作
  • 不确定的任务流
  • 适应行为
  • 分散式架构

Yan 就组织技术债务发出了警告。那些创建大量孤立、不可互操作且重用潜力极小的人工智能代理的公司,将为未来的集成噩梦埋下伏笔。

听起来很熟悉?我们都看到过各个部门的孤立 AI 实现堆积如山,每个实现都像一个潜力孤岛。这些脱节的系统与 JARVIS 的强大之处恰恰相反。

Yan指出,未来人工智能的成功更多地取决于创造持久的环境,让人工智能代理能够学习和有效运作,而不是单个模型。他还强调,最成功的实施如何保持战略性的人类监督,同时让人工智能自主处理日益复杂的任务。让人类和人工智能代理可以轻松地相互交互、与应用程序交互以及与数据交互。

跟踪你的人工智能实施成本

如果您认为实施 Agentic AI 仅仅涉及技术挑战,那么Arun Chandrasekaran关于成本优化的会议将是许多人所需要的现实的冷水澡。

他的预测令人警醒:

  • 到 2028 年,50% 的 GenAI 项目将因架构选择不当和缺乏运营知识而超出预算
  • 到 2028 年,模型推理成本将占模型生命周期总成本的 70%

环顾四周,我看到人们在心里重新计算他们的预算预测。房间另一边的集体点头证实了代理和生成 AI 的这些隐性成本终于得到了整个行业的认可。

Chandrasekaran 概述了优化 GenAI 成本的三大支柱的十大最佳实践:

强大的架构:

1)客观考虑准确性、性能和成本权衡
2)创建模型花园以促进选择和透明度
3)平衡模型增强的前期成本和运营成本
4)了解自托管权衡

高效的模型操作:

5)采用引导式提示设计来降低成本
6)实现 LLM 响应缓存
7)自动化模型选择和路由
8)建立 FinOps 消费治理

有效的变更管理:

9)教育用户如何采取成本效益高的措施
10)持续分析可见成本和隐藏成本

通过消除对昂贵且低效的模型定制技术(如 RAG(检索增强生成)或微调)的需求,同时仍提供上下文感知响应,我们将成本效率融入到架构本身中,而不是事后才想到。

分析正在从仪表盘发展到决策

丽塔·萨拉姆 (Rita Sallam)的“生成人工智能时代的分析的未来”演讲强调了分析如何经历巨大的转变。

根据 Gartner 的研究,74% 的 IT 和商业领袖认为 GenAI 加快了决策速度,而 65% 的人认为它能带来更好的决策结果。

Sallam 介绍了“感知分析”的概念,即利用 LLM 驱动的推理和 AI 代理来实现主动、情境化、结果驱动的决策。她预测,到 2027 年,增强分析功能将发展成为自主分析平台,全面管理和执行 20% 的业务流程。

从仪表板到决策平台的演变彻底改变了组织从数据投资中获取价值的方式。通过在语义丰富的基础上部署无幻觉、受管控的代理分析,我们能够实现 Sallam 所描述的那种感知分析,其中系统不仅显示数据,还积极帮助在正确的业务环境中理解数据,从而做出更明智的业务决策。

知识图谱的力量

Maryam Hassanlou关于图形分析和知识图谱的会议强调了人工智能成功的一个关键但经常被忽视的方面:数据元素之间的关系。

她的演讲强调了使用知识图谱弥合数据和人工智能之间差距的重要性,知识图谱可以提供高质量、语义丰富的数据,从而提高模型的有效性和准确性。

统计数据令人警醒:

  • 近 55% 的组织需要帮助来获得 AI 就绪数据
  • 许多组织缺乏基础数据管理实践

但机遇是巨大的。到 2026 年,图形技术将用于 80% 的数据和分析创新,高于 2021 年的 10%,从而帮助企业做出更好的决策。

我们将语义向量嵌入与知识图谱相结合,为 AI 计划创建全面的基础,捕获数据本身以及数据元素之间的关系。结合独特的领域特定本体,这为 AI 代理提供提供准确、无幻觉响应所需的丰富背景。

共同点——背景就是一切

当我将各个讨论之间的点连接起来时,出现了一种模式:上下文是现代数据策略的关键货币。

无论是:

  • Mark Beyer 谈论元数据成为组织的情境神经系统
  • Ben Yan 演示 AI 代理如何利用环境背景才能有效运行
  • Arun Chandrasekaran 解释缺乏情境意识如何导致成本上升
  • Rita Sallam 讨论分析发展的下一个人工智能阶段
  • Maryam Hassanlou 重点介绍知识图谱如何为人工智能提供语义背景

信息是一致的:孤立的数据点、断开的模型和孤立的数据是有效实施人工智能和最大限度地重复使用不同工作流程的代理的大敌。

当会议上的其他供应商专注于人工智能难题的各个组成部分时,我们采取了一种整体方法,正面解决背景和推理挑战。

这对您的数据和 AI 战略意味着什么

我不禁思考,这一切给我们这些数据和分析领导者带来了什么。以下是我对未来 12-18 个月的指导意见:

  1. 主动元数据
    :不要再将元数据视为文档,而要将其视为情报。重要的不是拥有更多元数据,而是激活您已有的元数据。
  2. 环境优于模型
    :较少关注单个 AI 模型,更多地关注创建持久环境,让 AI 代理可以从组织环境学习,实现最大程度的重复使用。
  3. 人工智能成本透明度
    :实施跟踪人工智能实施的可见成本和隐性成本的机制,特别关注推理成本。
  4. 语义本体基础
    :投资于跨不同数据源创建语义一致性的解决方案,而无需大规模的迁移项目。
  5. 决策智能
    :开始从数据驱动向决策中心思维的转变,专注于对您的业务最重要的决策。

人工智能成功的语义基石

如果我必须将整个 Gartner数据和分析峰会 2025 提炼为一个见解,那就是:未来属于为其 AI 计划构建自动化语义基础的组织。

这不仅仅是孤立的标记数据或知识图谱。它还涉及创建一个全面的语义结构,可以自动捕获业务的独特语言、关系和背景,让您的数据像您的员工一样说话。

在这个49% 的组织都在努力证明 AI 价值的世界中,自动激活元数据、创建情境感知 AI 代理以及通过单一事实来源本体提供无幻觉响应的能力是业务的当务之急。

当您回到自己的办公桌前时,是的,就是您开始阅读这篇文章的那张办公桌,可能还是皱着眉头,请记住,前进的道路并不像大多数供应商所表现的那样复杂。

借助正确的语义基础设施,您可以同时驾驭 Gartner 概述的三个历程——业务成果、能力和行为改变。

因为归根结底,数据不会做出决定,人会。


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多