说说英特尔的新显卡A380|设计|AMD|英特尔

瓜爷耶 2022-08-19 发布于湖北

展开全文

首先，请让我这个非计算机系出身的人，班门弄斧给各位科普一下“浮点乘法计算”的简单知识。

一个浮点数，根据占用内存长度的不同，一般分为半精度浮点，单精度浮点，双精度浮点数。而它们的乘法，就分别是：

半（精度）浮点乘法，主要用于人工智能深度学习，高级一点的深度学习也会用到半浮点和单浮点混合计算；

单幅点乘法，主要用于游戏，也是低端显卡主要突出的性能；

双浮点乘法，主要用于物理化学计算，小到吸尘器的设计，大到飞机的设计，计算流体力学都是双精度浮点，还有药物的化学反应，等等；也就是说，双浮点主要用于工程设计和科研。

下面让我们来看A380的三种浮点算力分别是多少：

可见，半浮点，单幅点，双浮点之间的比例是8：4：1。这样的设计，是总效率最优的设计，或者说，如果你要买一张显卡，但用途不是非常确定，在有限的总晶体管数量约束下，8：4：1是晶体管利用效率最高的组合。

然后是AMD 6500XT的算力：

半，单，双的比例是32:16:1。可见，AMD是砍掉了工程设计理化科研一块的用途，但对深度学习，还是比较厚道的。

让我们再看看英伟达的3050：

比例是64:64:1。你们终于知道老黄刀法的厉害了吧？即砍掉了工程设计理化科研，也没有给深度学习太多能力。这卡的唯一功能就是玩游戏，而它的游戏性能也确实是远超6500XT和A380。这里值得一提的是，早期的英伟达显卡，一直到Fermi那一代，都是接近8:4:1的算力比，之后砍掉了低端游戏卡的双浮点能力，再后来连Quadro系列的双浮点也砍掉了，部分原因是为了让有双精度需求的用户去买高价格的纯计算卡tesla系列。而AMD对低端卡的双浮点限制相对少一些，这就成了AMD错位竞争，田忌赛马的手段之一。

总结一下，A380就算驱动优化好了，游戏性能也很难超过6500XT，更是远低于3050。这个卡的定位并非游戏。但如果你不玩游戏，又需要一个独立显卡，A380毫无疑问，就是低端卡里面最合适的，既是因为解码能力，也是因为有些常用软件也是能用上双浮点算力的。而一些财务上比较紧张的做科学计算的理工科研究生们，会非常欢迎英特尔的这一代显卡。

最后，我想说的是，半单双性能的分配，并没有高下之分，而只有选择，或者说是侧重。

光追部分，我不懂，请各位补充，谢谢。

特别声明：以上文章内容瓜爷整理与互联网如有侵权请后台直接联系我