发布于 2024-05-27 关于使用cuBLAS gemm API时矩阵转置问题的分析 何度 691 热度 啥也没有呀 C/C++ cuBLAS简介 在科学计算和数值分析领域,经常需要解决矩阵特征值、线性方程(代数)等问题,形成了如EISPACK、LINPACK …
发布于 2024-05-09 element-wise 算子优化—gelu | Analysis-Driven Optimization(ADO) 何度 703 热度 啥也没有呀 cuda 记一次gelu算子优化的学习过程,gelu可以代表一类element-wise算子。由于我读文档获取的信息非常琐碎,打算用Anal …