首先,请让我这个非计算机系出身的人,班门弄斧给各位科普一下“浮点乘法计算”的简单知识。 一个浮点数,根据占用内存长度的不同,一般分为半精度浮点,单精度浮点,双精度浮点数。而它们的乘法,就分别是: 半(精度)浮点乘法,主要用于人工智能深度学习,高级一点的深度学习也会用到半浮点和单浮点混合计算; 单幅点乘法,主要用于游戏,也是低端显卡主要突出的性能; 双浮点乘法,主要用于物理化学计算,小到吸尘器的设计,大到飞机的设计,计算流体力学都是双精度浮点,还有药物的化学反应,等等;也就是说,双浮点主要用于工程设计和科研。 下面让我们来看A380的三种浮点算力分别是多少: 可见,半浮点,单幅点,双浮点之间的比例是8:4:1。这样的设计,是总效率最优的设计,或者说,如果你要买一张显卡,但用途不是非常确定,在有限的总晶体管数量约束下,8:4:1是晶体管利用效率最高的组合。 然后是AMD 6500XT的算力: 半,单,双的比例是32:16:1。可见,AMD是砍掉了工程设计理化科研一块的用途,但对深度学习,还是比较厚道的。 让我们再看看英伟达的3050: 比例是64:64:1。你们终于知道老黄刀法的厉害了吧?即砍掉了工程设计理化科研,也没有给深度学习太多能力。这卡的唯一功能就是玩游戏,而它的游戏性能也确实是远超6500XT和A380。这里值得一提的是,早期的英伟达显卡,一直到Fermi那一代,都是接近8:4:1的算力比,之后砍掉了低端游戏卡的双浮点能力,再后来连Quadro系列的双浮点也砍掉了,部分原因是为了让有双精度需求的用户去买高价格的纯计算卡tesla系列。而AMD对低端卡的双浮点限制相对少一些,这就成了AMD错位竞争,田忌赛马的手段之一。 总结一下,A380就算驱动优化好了,游戏性能也很难超过6500XT,更是远低于3050。这个卡的定位并非游戏。但如果你不玩游戏,又需要一个独立显卡,A380毫无疑问,就是低端卡里面最合适的,既是因为解码能力,也是因为有些常用软件也是能用上双浮点算力的。而一些财务上比较紧张的做科学计算的理工科研究生们,会非常欢迎英特尔的这一代显卡。 最后,我想说的是,半单双性能的分配,并没有高下之分,而只有选择,或者说是侧重。 光追部分,我不懂,请各位补充,谢谢。 特别声明:以上文章内容瓜爷整理与互联网如有侵权请后台直接联系我 |
|