2 posts
从最简单的向量加法开始,学习 Triton 内核的编写和性能调优技巧。
学习如何使用 OpenAI Triton 编写高效的 GPU 内核,实现 Softmax 操作并理解 Triton 的编程模型。