|
发表于 2021-4-13 20:35:54
|
显示全部楼层
本帖最后由 thomasbbq 于 2021-4-13 20:38 编辑
OpenCL是通用计算业界标准API。
一个实例开发出来可以部署到几乎所有当代硬件平台:x86/ARM/RISC-V/MIPS/IBM Power/NVIDIA GPU/AMD GPU/Intel GPU
NV再厉害,能完全覆盖存量上百亿的手机?
P.S.
我看你是连看Wiki搜测试数据都不会,我就用是个人看得懂的话跟你说清楚ROCm凭什么落到现在这个田地。
OpenCL是个开放通用驱动级API(一般开发者能接触到的最高硬件控制权),基本上是个能加减乘除的电子设备都能用。
开放联盟导致规范不严谨,执行效率一般般。
CUDA是一个专用运行时(比驱动级API高级,满足一般开发者99.99%情况下所需要的硬件控制权),只有NV GPU才能用。
独家专用规范清晰,执行效率比OpenCL高一大截。多年积累下有非常活跃的社区,大量现成实例可参考。
ROCm是一个基于OpenCL这个驱动级API开发出来的专用运行时,只有AMD GPU才能用。
基于OpenCL导致其执行效率天花板由OpenCL决定。后发劣势导致其用户极少,社区约等于不存在。
看懂了吗?
脑子正常的人,都不会用一个没有性能优势、不可移植、还没有经验可参考的专用运行时写程序。 |
评分
-
查看全部评分
|