有人说,我做一款AI芯片,只要原生支持PyTorch就好了呀,用户直接用PyTorch跑模型,根本接触不到CUDA呀。
没错,一般的用户只要在PyTorch层面做应用,但是总是有新的模型架构出来,这些架构都需要做特定的性能优化才能在一个芯片上得到较高的性能,这时候就涉及到算子开发了。
比如说一开始LLM在GPU上的性能不好,后来社区针对Nvidia GPU做了flash attention等的优化才把LLM的性能提升到了比较可观的程度。
CUDA已经被各种开源AI框…。
代码:
为什么任天堂在NS2上没有选择使用OLED屏幕以提升续航能力和显示效果?
中国 GPS 定位的偏移(GCJ-02坐标系 / 火星坐标系)的存在意义是什么?真的有作用吗?
北京暴雨故宫再现「千龙吐水」奇观,为什么故宫古老排水系统历经六百年仍能正常运作?有哪些特别之处?
俄罗斯妹子***漂亮热情,中国男人是不是很喜欢娶?
只有三人的前端团队开发适合上微前端吗?
怎么正确的走GIS开发这条路?
PHP现在真的已经过时了吗?
宁波东方理工大学学费每人每学年 9.6 万,为什么会这么贵?
技嘉M27Q显示器的KVM功能有什么用?
Manus会不会开源?
都是研制核武器,为何只敢动伊朗,对朝鲜确畏首畏尾?
Electron 做游戏客户端的潜力有多大?
在微软(Microsoft)工作是怎样一番体验?
为何 Linus 一个人就能写出这么强的系统,中国却做不出来?
如果不能使用linux,只能选鸿蒙与windows,你会选哪个?
请问27寸4K显示器哪个好呀?
活在底层的人是什么样子?
软路由是否被过度神化?
程序员明明是技术积累岗位,为什么年龄越大反而可替代性变高了?
Mac 上哪些好用的软件可以推荐?
HTTP/3 解决了什么问题,又引入了什么新问题?
世界最大医院郑大一附院有多牛?
我想不通,类似东方树叶这种毫无技术也没什么添加剂的茶叶水,是怎么敢卖5块的???
苹果 6 月 10 日召开的 2025 年全球开发者大会「WWDC25」,有哪些值得关注的信息?
为什么鸿蒙PC要排斥Linux生态?
数据库不就是增删改查一些数据吗?研发一个数据库到底难在哪了?
为什么 macOS 上国产软件不流氓?
为什么 Windows 没有比较成熟的第三方桌面环境(explorer.exe)?
为什么华为价值2.3W的鸿蒙电脑用的是美国西数的SN740固态硬盘?