分享

2022年计算机算力专题研究 后摩尔时代,算力从PC走向AI集群(图)

 阅读美丽星空 2022-09-28 发布于山东

2022年计算机算力专题研究 后摩尔时代算力从PC走向AI集群

来源财通证券 发布时间2022/09/13  

1. 算力是数字经济时代生产力

1.1.数据成为经济发展重要生产要素

按照 IDC 总结全球计算数据的创建与使用总结为三个阶段

1980 年以前数据集中在数据中心存储与处理即使可通过远程访问终 端计算能力低下也无法对数据进行深度计算数据均为商用

1980-2000摩尔定律显威PC 兴起数据的产生处理与存储更多流向 终端同时出现了音乐电影和游戏的数字娱乐产业

2000 至今无线宽带普及推动数据进入云端将数据与特定的物理设备脱 钩社交与流媒体的兴起使得数据中心更多承担数据交互与集中计算任务 而在不断交互过程中数据量高速增长

数据量呈现指数级增长企业端占比不断提升根据中国信通院到 2035 年 全球数据量将达 2142ZBZBZettabyte1ZB 约十万亿亿字节是 2020 年所创建数据量的 45-46 倍而由于进入云时代数据在本地存储的需求逐步 减少企业在云端可为客户提供实时的数据和服务

数据逐渐成为经济发展的重要生产要素基于云能够快速访问的数据运用方式 数据日益影响企业和日常生活例如商业航空旅行自动驾驶医疗应用控制 系统和遥测技术等社会生产力紧密相关的数据占比持续提升IDC 预计到 2025 年娱乐相关的消费型数据占比将从 2012 年接近 60%下降至 30%左右余下 约 70%将是非娱乐化的图像/视频生产力数据工业生产等嵌入式数据

1.2.数据重要性提升多维数据整合挖掘深度价值催生算力旺盛需求

重要数据量快速增长不同数据间的重要性相差较大例如医疗类数据重要于 流媒体数据不同数据运行出现问题所造成的影响亦不同例如私用 PC 宕机造 成文件丢失和自动驾驶数据错误造成人员伤亡IDC 预计未来关键数据量增速将 高于数据量总体增长2025 年需要安全防护的企业经营/医疗记录等数据占比将 达 87%

单个数据的价值下降多维数据整合方可挖掘深度价值进一步催生算力需求 当前数据指数级增长的同时数据类型也更加多元化在交通工业商业运营 等领域少量单一化的数据的价值较低只有将大量多维度的数据进行综合 分析才能产生应有的价值例如交管领域对于黑车的识别需要将车辆行驶轨迹 车辆图像识别人像识别与对比车牌登记数据比对等多维度数据进行分析才能 准确筛选对于庞杂的不同类型数据尤其非结构化的统一分析与存储的需求 催生了数据湖概念同时随着云计算技术的深入应用带来资源集约化和应用灵 活性优势的云原生概念也产生大规模集群计算需求旺盛

全球超级数据中心占比快速提升算力进一步集中近五年全球数据中心任务量 增长 135%大数据挖掘与应用人工智能深度学习需求旺盛随着摩尔定律逐 渐走向极限超级数据中心成为数据中心主要增量根据 Cisco 数据全球超级 数据中心打造服务器数量占所有数据中心搭载服务器比例由 2016 年的 27%提 升至 2021 年的 53%

1.3.算力正成为经济增长主要动力之一

算力已成为数字经济时代的关键生产力要素在传统的西方经济学理论中驱动 社会经济发展的生产要素包括了劳动资本土地企业家的才能等而在一系 列新兴信息数字技术的兴起与广泛应用的数字经济时代中与计算能力的形成直 接相关的算力资本投入数据算力算法如同农业时代的水利工业时代的 电力已成为数字经济发展的核心生产力是国民经济发展的重要基础设施国 务院印发的十四五数字经济发展规划中也明确提及到 2025 年我国数字 经济核心产业增加值占 GDP 比重将从 2020 年的 7.8%上升到 10%数字经济 将为经济社会持续健康发展提供持续动力

中美算力规模全球领先截至 2021 年底全球数据中心算力总规模达 521EFLOPSEFLOPS每秒进行 10^18 次浮点运算中美两国算力规模分 别约为 161EFLOPS 和 140EFLOPS占全球总算力份额约为 31%和 27%

计算力和 GDP 增长显著相关根据 IDC 等机构的研究全球平均来看他们构 建的计算力指数每提升 1 个点国家数字经济和 GDP 将分别增长 3.5‰和 1.8‰同时计算力指数越高对 GDP 的拉动作用越显著

1.4.东数西算数字经济时代新基建启航

大数据时代算力与数据增长齐头并进根据中国算力白皮书2022 年的 数据2021 年我国算力总规模达到 140Eflops每秒一万四千亿亿次浮点运算 包含通用算力智能算力超算算力边缘算力暂未纳入统计范围全球占比约 为 27%近五年年均增速超 30%展望未来工信部印发的十四五信息通 信行业发展规划指出 2025 年我国数据中心算力总规模将增长到 300EFLOPS CAGR 达 22%另一方面伴随 5G人工智能物联网等技术的应用普及 数据流量增长速率也在不断加快根据 IDC 的预测全球数据总量在 2020 年 将达 50ZB而这一数据到 2025 年有望达到 175ZBCAGR 达 28%与此同 时根据中央网信办的数据统计2019 年度中国移动互联网数据接入量为 1,655.50 亿 GB预计 2024 年将达到 5,680.90GBCAGR 也高达 28%因 此我们认为在当前数字经济大时代下适度超前建设以数据中心为首的新型基 建具有明确的战略意义

东数西算正式启动预计每年带动 4000 亿投资今年二月国家发展改革 委中央网信办工业和信息化部国家能源局联合印发通知同意在京津冀 长三角粤港澳大湾区成渝内蒙古贵州甘肃宁夏等 8 地启动建设国家 算力枢纽节点并规划了 10 个国家数据中心集群标志着东数西算工程正 式全面启动西气东输西电东送南水北调等工程相似东数西 算是一个国家级算力资源跨域调配战略工程针对我国东西部算力资源分布总 体呈现出东部不足西部过剩的不平衡局面引导中西部利用能源优势建设 算力基础设施数据向西算力向东服务东部沿海等算力紧缺区域解决 我国东西部算力资源供需不均衡的现状东数西算工程对我国的长远发展有 重要的意义

有利于提升国家整体算力水平通过全国一体化的数据中心布局建设扩大 算力设施规模提高算力使用效率实现全国算力规模化集约化发展

有利于促进绿色节能数据中心属于高耗能行业又被称为不冒烟的钢厂 将数据中心从能耗指标紧张的东部地区迁往清洁能源富集电力更加廉价的 西部将大幅提升绿色能源使用比例降低数据中心运营的成本

有利于扩大有效投资数据中心产业链条长投资规模大带动效应强发 改委预计十四五期间大数据中心投资还将以每年超过 20%的速度增长 每年预计各方面投资额达 4,000 亿元

有利于推动区域协调发展通过算力设施由东向西布局将带动相关产业有 效转移促进东西部数据流通价值传递延展东部发展空间推进西部大 开发形成新格局

2. 后摩尔时代算力从 PC 走向 AI 集群

2.1.后摩尔时代传统计算架构亟待革新

AI 算量需求急剧增加传统架构难以满足根据摩尔定律集成电路上可以容纳 的晶体管数目大约每 18 个月增加一倍而 AI 训练算量自 2012 年开始以平均 每 3.43 个月翻倍的速度实现指数增长在芯片制程达到个位数纳米级的当下 传统芯片算力提升速度难以赶上计算量增速

下游应用的高景气度和不断衍生的智能化需求推动芯片革新中国云计算市场 规模增长迅速2021 年达到 3229 亿元近 5 年 CAGR 达 44.6%云计算作 为人工智能云端训练芯片的主要应用场景推动了芯片架构迭代

2.2. AI 算力需求旺盛GPU 是主流

GPU 是当前主流数据中心端 AI 计算架构按技术架构分类AI 芯片可分为图 形处理器GPU现场可编程门阵列FPGA专用集成电路ASIC类脑 芯片GPU 起初强调图形处理随着强大的并行计算能力被发掘逐步进入通 用计算领域FPGA 以半定制化为特征注重于服务垂直领域ASIC 则是针对 客户应用场景需求进行定制类脑芯片尚处于起步阶段

智能算力需求旺盛GPU 充分受益从市场规模来看2021 年服务器 GPU 全 球市场规模达到 71.5 亿美元2019-2021 年复合增速 66%占服务器整体市 场规模比例快速提升同期 FPGA 全球市场规模为 7.9 亿美元相比 2020 年 基本持平而 ASIC 主要用于终端推理我们认为中期看 GPU 仍将是数据中 心端 AI 训练等加速计算的主流芯片充分受益于智能算力高景气

2.3. Nvidia&AMD市值超越 Intel时代算力从 PC 端走向 AI 集群

Nvidia2022 年上半年数据中心收入占比超过 50%受益于智能算力高景气 Nvidia 作为全球 GPU 龙头数据中心业务占比历年快速提升由 2014 年的 6.8%提升至 2022 年上半年的 50.4%是主要收入增长动力

AMD数据中心端发力抢占 X86 市场AMD 于 2016 年发布 Zen 架构相 比 Intel 的 IDM 模式AMD 的 fabless 模式在当前芯片制程接近极限背景下更 具优势借助全球领先 foundary 厂领先于 Intel 自身的制程优势性能持续追 赶尤其在服务器 CPU 方面是 AMD 抢占 intel 市场的主要发力点在 X86 芯片的市场份额持续提升至 2021Q4 的 10.7%

Nvidia 和 AMD 市值双双超越 Intel时代算力从 PC 端走向集群 AI 端得益于 Nvidia 在数据中心市场的强劲表现和 AMD 在服务器 CPU 市场的发力目前它 们的市值均已超越 Intel虽然 Intel 目前的收入和利润体量明显高于 Nvidia 和 AMD但是资本市场给予后两者估值溢价明显标志着时代算力正从传统的 PC 端走向服务器的 AI 集群产业浪潮不可逆转

3. 人工智能开启算力时代

3.1.AI 三要素数据算法算力

AI 行业快速发展智能算力需求提升根据使用设备和提供算力强度的不同算 力可分为基础算力智能算力与高端算力三大类随着深度学习技术的快速发展 以及互联网和云计算时代海量数据和高效计算能力的支撑计算机视觉技术语 音技术自然语言理解技术等人工智能技术取得了突破性进展并解锁多个行业 的人工智能场景驱动了人工智能行业相关的计算量快速增长根据中国算力 白皮书2022 年的数据统计2021 年全球智能算力总规模达 113EFLOPS 占全球总算力规模的 22%我们认为伴随人工智能技术的复杂性不断增加人 工智能计算能力的需求将呈指数级增长

AI 三要素相互耦合共同生成 AI 模型一个传统的 AI 模型包括训练和推断预 测两大部分训练环节指将训练数据通常为现有的历史数据输入进算法中 通过 AI 芯片GPUFPGA 等提供算力支撑以及数据工程师的分析调参 最后生产满足特定功能的 AI 应用模型推断环节指通过向训练完成的 AI 应用模 型中输入实际应用场景中的新数据并生产对应的推断结果在这一过程中数 据算法和算力扮演着同等重要的角色三要素的耦合关系是探索 AI 未来发展 道路的重要基础

数据是 AI 模型的汽油数据是一切人工智能的基础数据因其可具象性 强也是最容易被理解的竞争壁垒特斯拉在自动驾驶数据的积累科大讯 飞在智慧教育的题库数据积累等未来数据的突破口在于 1数据积累的 行业下沉智能化渗透率的提升传感技术的升级等2现有数据的打通 实现将不同行业政府与企业间的数据互联互通因此在特定行业具 备数据积累先发优势和跨行业数据整合能力的公司有望形成保持领先

算力是 AI 模型的发动机算力是最容易被直观量化的指标英伟达每年 推出的新 GPU 参数但也是目前最大的瓶颈算力的瓶颈并不体现在算 力的绝对大小而在于实现该算力的成本特别是在算法场景众多迭代速 度较快的 AI 领域如何设计出同时满足通用性和高算力的 AI 芯片仍是当下 炙手可热的话题因此具备由单一芯片模式往融合异构多芯片模式发展能 力的公司有望率先受益

算法是 AI 模型的大脑算法是 AI 实现技术跃迁的根本也是最难以被 直观理解的部分从 AlexNet 重新复兴神经网络到 Transformer 开启大模 型时代人工智能的每一次里程碑事件都伴随着算法层面的突破与创新往 后展望一个好的算法除了能更好的完成设定的任务外还需具备 1更强 的通用性激活更多的可用数据2更优化的计算原理减少算力的负担 因此我们认为在 AI 领域具备科研资源和资金实力的公司将有望拔得头筹

3.2. 大模型横空出世人工智能进入算力时代

深度神经网络模型为 AI 行业注入新动能英国数学家阿兰·图灵在 1950 年提 出了机器能思考吗这一跨世纪的命题, 人类从未停止过对智能化的思考与探 索自 1956 年达特茅斯会议上首次提出人工智能概念以来人工智能技术与应 用已经发展 60 多年经历了多次高潮和低谷过去的十年间我们有幸见证了 深度学习的兴起为行业的发展注入的惊人的活力

2012 年 AlexNet一种卷积神经网络模型引入了利用 GPU 并行运算 以压倒性的准确率夺得了当年 ImageNet 图像识别大赛的冠军带来了深 度神经网络的又一次复兴

2016 年 DeepMind 开发的人工智能 AlphaGo 打败人类顶尖棋手李世石 开启了人工智能发展的新纪元

2017 年 Google 团队提出的 Transformer 模型横空出世成为了日后自 然语言学习NLP计算机视觉CV的架构标准基于 Transformer 的 预训练模型 BERT 更是将 NLP 模型的精准度和泛化能力带上了新的台阶

2020 年有 1750 亿参数的 GPT-3Generative Pre-trained Transformer 3的诞生标志着大模型正在成为迈向强人工智能的 重要一步

伴随场景与数据的激增大模型或许成为规模化创新的基础大模型指通过超大 规模的参数设置和数据输入通过大算力和大数据以及强大的算力支撑与训练 而得出的基础的具有通用性的综合的大模型大模型浪潮最早起源于预训练 模型Google 发布的 BERT 模型即是自然语言处理领域最为典型的预训练模 型OpenAI 则提出了 GPT 模型尤其是 2020 年发布的 GPT-3 模型参数量 即达到 1750 亿在全球掀起大模型的浪潮大模型可以使人工智能具备处理语 言视觉机器人推理人际互动等各类相关任务的能力因此这类模型将赋 能各行各业加快传统行业的智能化转型在法律医疗教育等领域都会带来 积极影响例如 Meta 推出的拥有 150 亿个参数的 ESMfold 模型可以在原子大 小的精度上预测蛋白质的三维结构推测速度比 AlphaFold2 快出一个数量级 可以说在 AI 模型开发领域经历了预训练模型-大规模预训练模型-超大规模 预训练模型的演进

3.3.异构计算突破算力瓶颈

大模型问世AI 计算量需求指数增长如第二章所述AI 训练算量自 2012 年 开始以平均每 3.43 个月翻倍的速度实现指数增长但摩尔定律逼近极限同期 算力增长仅 7 倍远低于 AI 模型计算量的 30 万倍由于实现人工智能所需的 深度学习算法需要很高的内在并行度大量浮点计算能力以及强大的矩阵运算能 力其与图形渲染有着相似之处这为使用 GPU 训练深度神经网络打下了理论 基础自 2012 年 AlexNet 面世之后GPU 及 AI 加速器DSA的广泛应用 使得硬件计算能力的不足得以被快速弥补人工智能行业迎来了又一次加速发展

异构计算打破 AI 芯片算力瓶颈大模型训练自动驾驶等复杂应用场景对算力 的追求没有止境尽管过去 10 年晶体管的数量依然随摩尔定律增长但单核处 理器性能已经出现明显瓶颈晶体管的数量增长主要来自于核心数量的增加算 力提升需要寻求新的突破点

单个处理器的性能提升目前集成电路制程工艺的边际提升极其困难考虑 到硅原子的直径约为 0.1nm在 3nm 制程之后量子隧穿效应Quantum tunnelling effect会越来越明显因此单纯通过改进工艺以提高晶体管密 度从而提升芯片性能的方法已难以满足大数据和人工智能时代下的业务规 模爆炸性增长

处理器的核心数量增加核心数的增加会提高芯片功耗成本并且需要软 件端适配多核尽管东数西算等项目能从宏观层面增加全社会的总算力 但 AI 芯片大规模落地的前提是满足 AI 场景快速迭代的通用性否则新增的 算力依然会出现利用率低成本高

处理器的灵活度提升随着算力需求不断攀升单一计算类型/架构的处理器 无法应对多样的数据处理任务当前GPGPU 作为一种异构计算方案灵活可编程能力与 AI 算法的需求相对匹配是目前 AI 算力的主流技术路线 我们认为随着 Chiplet 技术的逐步成熟异构并行计算将向架构更加复杂 的超异构计算演进创造出更加兼顾算力和灵活性的新可能

本文仅供参考不代表我们的任何投资建议如需使用相关信息请参阅报告原文

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多