AI :: SAO Blog

强化学习基础与 Q-Learning

2024年10月2日 18:17 40 min read

从零开始学习强化学习的基础概念，深入理解 Q-Learning 算法及其在离散动作空间中的应用。

RLAI

Vector Add in Triton

2024年9月19日 15:06 20 min read

从最简单的向量加法开始，学习 Triton 内核的编写和性能调优技巧。

TritonDeep LearningAI

LLM 演进史 (六)：揭开 Tokenizer 的神秘面纱

2024年7月4日 16:42 50 min read

深入理解 Tokenizer 的工作原理，学习 BPE 算法、GPT 系列的分词策略以及 SentencePiece 的实现细节。

LLMAITokenizerBPENLP

微调之道

2024年3月15日 14:46 20 min read

学习如何在有限的显存条件下微调大语言模型，掌握半精度、量化、LoRA 和 QLoRA 等关键技术。

AILLM微调

LLM 演进史 (四)：WaveNet——序列模型的卷积革新

2024年3月9日 16:01 30 min read

学习 WaveNet 的渐进式融合思想，实现树状分层结构来构建更深的语言模型。

AI深度学习LLM

LLM 演进史 (三)：批归一化——激活与梯度的统计调和

2024年2月29日 15:44 35 min read

深入理解神经网络训练中的激活和梯度问题，学习批归一化如何解决深层网络的训练难题。

深度学习AI

GPT 的现状

2024年2月18日 20:16 30 min read

整理 Andrej Karpathy 在 Microsoft Build 2023 的演讲，深入理解 GPT 的训练过程、发展现状、当前 LLM 生态以及未来展望。

AIChatGPTLLMGPT

LLM 演进史 (二)：词嵌入——多层感知器与语言的深层连接

2024年2月17日 21:48 25 min read

探索 Bengio 的经典论文，了解如何通过神经网络学习词的分布式表示，以及如何构建一个神经概率语言模型 (NPLM)。

AILLM深度学习词嵌入神经网络

LLM 演进史 (一)：Bigram 的简洁之道

2024年2月17日 11:05 20 min read

从最简单的 Bigram 模型开始，探索语言模型的基础。了解如何通过计数和概率分布来预测下一个字符，以及如何用神经网络框架实现相同的效果。

AI深度学习LLM语言模型

从 0 实现一个极简的自动微分框架

2024年2月16日 10:28 25 min read

学习 Andrej Karpathy 的 micrograd 项目，从零开始实现一个自动微分框架，深入理解反向传播和链式法则的核心原理。

深度学习AIPyTorch自动微分神经网络

#AI