昨天我们谈到了外媒对AMD高层领导,高级副总裁兼计算图形业务集团总经理杰克·胡恩Jack Hyunh的采访,AMD明确了接下来的Radeon消费级显卡产品战略,即以性价比抢占市场。然而以上只是采访内容的一部分,Tom's Hardware公布了更重要的消息。胡恩宣布,公司将把面向消费者的RDNA和面向数据中心的CDNA架构统一,整合为命名UDNA的新型微架构,这是AMD应对英伟达庞大CUDA生态奠定的基础。胡恩解释了AMD战略的背后原因,以及采取新统一设计的理由:如今我们为Instinct数据中心GPU打造了CDNA架构,为消费级产品打造了RDNA——它们是不同的分支。而展望未来,我们将重整为UDNA,这是一个统一的架构,包括Instinct和客户端产品。这样一来,开发者将可以更轻松地使用它。 我们当年对架构进行了分叉,因为这样可以获得子优化和微优化,但是这对于开发者来说难度大增,尤其是我们还在发展数据中心业务,所以我们需要统一架构。这是我们计划的一部分,就像我说的,我们要吸引更多的开发者,从数百数千到数十万上百万,这是我们想要达到的目标,这是我们现在必须要建立的规模。 胡恩还谈到了UDNA的进一步细节,团队认为他们在RDNA上犯了一些错误,每当想要更改内存层次结构、子系统时,都需要重置优化矩阵。而在UDNA上公司不希望重蹈覆辙,因此团队亟需解决向前的发展和向后的兼容性问题。而对于将两套架构整合为统一的UDNA,公司仍然需要时间,因为当前团队不同部门都还在做不同的工作,首先需要的是降低复杂性。从开发者角度来看,他们会喜欢这个策略,实际上开发者社区早就希望我们这样做,但正如飞机无法在空中更换发动机,我们必须找到正确的方法来设定计划,这样才不会产生破坏。 虽然尖端芯片可以主导市场,但软件的支持才会决定胜负。英伟达的成就已经展示了如何利用无与伦比的CUDA生态系统构建看似坚不可摧的护城河。十八年前,英伟达从CUDA开始奠定帝国的基础,最根本的优势在于CUDA中的“U”(Unified:统一)上。英伟达只拥有一个适用于所有用途的CUDA平台,利用相同的底层微架构实现AI、HPC和游戏。 CUDA拥有超过400万开发者,而AMD的目标就是让UDNA推广到这一开发者规模。这毫无疑问是个艰巨的任务。当下AMD需要继续依赖开源ROCm软件堆栈来对抗英伟达,但是这同样也需要用户和开源社区的支持。AMD作为开源社区的主导者,每次针对某些类型的应用程序/游戏进行一些微优化,都能有助于加速ROCm生态发展。UDNA究竟会发生什么样的变化,胡恩没有明说。但当下一个明显痛点便是RDNA架构中缺乏专用的AI加速单元,即使是后来者,英特尔也在Xe图形架构中加入了专用XMX矩阵。2018年,英伟达开启了RTX产品家族,最大的开拓性便是Tensor Core。AMD在最新的RDNA3中仅有有限的AI加速,基本只能通过WMMA指令以优化方式访问FP16单元,而6000系的RDNA2中则完全依靠着色器进行此类工作。因此UDNA势必将拥有对Tensor操作的全栈支持,但AMD还有很长的路要走,全球AI市场涉及超过3000亿美元,AMD作为源头的硬件软件提供商巨头之一,公司执行新的微架构战略显然是当务之急。然而目前看来,UDNA似乎还需要至少一代,约两年后才能看到初代产品。
|