Menu
Avatar
The menu of my blog
Quick Stats
Quests
31 Quests
Messages
2 Messages
Playback
5 Playback
Items
14 Items
Skills
2 Skills
Trace
1 Trace
Message

The Sword Art Online Utilities Project

Welcome, traveler. This is a personal blog built in the style of the legendary SAO game interface. Navigate through the menu to explore the journal, skills, and item logs.

© 2020-2026 Nagi-ovo | RSS | Breezing
Quests

#LLM

9 posts

从 RL 来,到 RLHF 去

从 RL 来,到 RLHF 去

2025年5月8日 14:15 50 min read

本文主要基于 Umar Jamil 的课程进行学习和记录。我们的目标是让 LLM 的行为与我们的期望的输出相一致,RLHF 则是最著名的技术之一。

深度学习RLHFLLM
用 Rust 实现简单 LLM 推理

用 Rust 实现简单 LLM 推理

2025年2月7日 14:48 40 min read

在 B 站偶然刷到清华大学主办的大模型与人工智能系统训练营,果断报名参加。计划利用春节返乡时间通过实践巩固 LLM Inference 的理论知识,恰逢学校 VPN 故障无法科研,正好整理学习笔记。

LLMRustmlsys
LLM 演进史 (六):揭开 Tokenizer 的神秘面纱

LLM 演进史 (六):揭开 Tokenizer 的神秘面纱

2024年7月4日 16:42 50 min read

深入理解 Tokenizer 的工作原理,学习 BPE 算法、GPT 系列的分词策略以及 SentencePiece 的实现细节。

LLMAITokenizerBPENLP
LLM 演进史 (五):构筑自注意力之路——从 Transformer 到 GPT 的语言模型未来

LLM 演进史 (五):构筑自注意力之路——从 Transformer 到 GPT 的语言模型未来

2024年3月20日 08:49 60 min read

从零开始构建 Transformer 架构,深入理解自注意力机制、多头注意力、残差连接和层归一化等核心组件。

LLMGPT深度学习Transformer
微调之道

微调之道

2024年3月15日 14:46 20 min read

学习如何在有限的显存条件下微调大语言模型,掌握半精度、量化、LoRA 和 QLoRA 等关键技术。

AILLM微调
LLM 演进史 (四):WaveNet——序列模型的卷积革新

LLM 演进史 (四):WaveNet——序列模型的卷积革新

2024年3月9日 16:01 30 min read

学习 WaveNet 的渐进式融合思想,实现树状分层结构来构建更深的语言模型。

AI深度学习LLM
GPT 的现状

GPT 的现状

2024年2月18日 20:16 30 min read

整理 Andrej Karpathy 在 Microsoft Build 2023 的演讲,深入理解 GPT 的训练过程、发展现状、当前 LLM 生态以及未来展望。

AIChatGPTLLMGPT
LLM 演进史 (二):词嵌入——多层感知器与语言的深层连接

LLM 演进史 (二):词嵌入——多层感知器与语言的深层连接

2024年2月17日 21:48 25 min read

探索 Bengio 的经典论文,了解如何通过神经网络学习词的分布式表示,以及如何构建一个神经概率语言模型 (NPLM)。

AILLM深度学习词嵌入神经网络
LLM 演进史 (一):Bigram 的简洁之道

LLM 演进史 (一):Bigram 的简洁之道

2024年2月17日 11:05 20 min read

从最简单的 Bigram 模型开始,探索语言模型的基础。了解如何通过计数和概率分布来预测下一个字符,以及如何用神经网络框架实现相同的效果。

AI深度学习LLM语言模型
Session 00:00:00