最近和很多朋友在聊智算中心的建设方案,经常会拿“智算中心”和传统的数据中心、超算中心进行比较,很多非相关领域的朋友很难分清楚这三者的区别和联系,今天我们从不同的维度和大家分析一下它们各自的特点。 一、“数据中心”建设是体系化工程 “智算中心”作为最近两年兴起的新生事物,可以理解为是由传统“数据中心”演变而来,从本质上讲并没有太大区别,只因为承载的业务重心转为了人工智能的训练、推理等,因此命名为“智算中心”,介绍三类数据中心区别之前我们先从系统层面了解一下传统“数据中心”建设的组成。 1、L0层为土建工程:传统数据中心和智算中心的区别很小,因为智算建设算力密度提升,往往需要对地面的的承重有所增加,在建设成本和规划上没有太大变化。 2、L1为机房基础设施:可以理解为是给IT基础设施提供支撑的,机房的装修、供电、制冷、综合布线、机柜、液冷系统等都属于这一层,智算中心带来的变化是由低密向高密转变、由风冷向液冷(或者风液混合)转变、由低容量向高容量供电转变。 3、L2是IT基础设施:传统数据的三大件“计算、存储、网络”,在智算中心规划中也不例外,只是结构比例有所不同,体现在计算部分占比提升(约70-80%),以AI算力(主要是GPU)为主,网络也由传统的以太网方案转为RDMA网络(IB和Roce)为主,当然存储的性能容量也有变化。 4、L3和L4是平台和业务层:因为智算中心业务类型的转变(以AI大模型的训练和推理为主),所以在这两层会和传统数据中心有较大的变化(下文具体展开)。 二、“智算中心”的定义和概念 怎么去理解“智算中心”其实不同的领域对其定义也有所差异,下面图片是来自“中国通服数字基建产业研究院(华信咨询设计研究院)”对智算中心的两个定义,我们可以作为参考。 狭义的智算中心:是智能算力的物理载体,是“机房+网络+GPU 服务器+算力调度平台”的融合基础设施,是传统数据中心的增值性延伸。 广义的智算中心:是人工智能软硬件技术一体化的载体,是“算力+数据+算法”的融合服务,是促进 AI 产业化和产业 AI 化的重要引擎,是传统云数据中心的智能化升级。 三、“智算中心”与超算和传统数据中心的对比分析 数据中心的建设与社会的发展需求紧密结合,在不同发展阶段出现了通用计算数据中心、超级中心、智算中心等不同形态的算力基础设施,其本质也是从信息化走向数字化、智能化的过程。下面从建设的目的、功能特点、应用领域和投建运模式几个维度进行简单的对比分析: 1、建设目的:
2、功能特点:
3、应用领域:
4、投建运模式:
以上只是简单把三种算力中心做了比较,仅供大家参考! |
|