Nagi-ovo
关注
Breezing homepage: [nagi.fun](nagi.fun)
136
关注者
17
正在关注
赞助
主页
归档
作品集
日寄
归档
标签
深度学习
(10)
强化学习
(4)
MCTS
(1)
Self-Play
(1)
RL
(5)
PPO
(1)
知识蒸镏
(1)
Follow
(1)
actor-critic
(1)
AI
(10)
LoRA
(1)
PEFT
(1)
PyTorch
(2)
Triton
(2)
Deep Learning
(1)
Python
(1)
Policy Gradient
(1)
WSL
(1)
环境配置
(1)
LLM
(7)
Tokenizer
(1)
BPE
(1)
NLP
(1)
GPT
(1)
Transformer
(1)
微调
(1)
ChatGPT
(1)
词嵌入
(1)
祝你生日快乐
(1)
2024
Let's build AlphaZero
11月26日
“速通” PPO
11月13日
知识蒸馏入门学习
11月3日
破解 Follow 邀请码的历程
10月31日
Actor Critic 方法初探
10月10日
从 DQN 到 Policy Gradient
10月6日
强化学习基础与Q-Learning
10月2日
LoRA in PyTorch
10月1日
Vector Add in Triton
9月19日
Softmax in OpenAI Triton
9月14日
Policy Gradient 入门学习
9月12日
WSL2 配置 Ubuntu20.04
8月20日
LLM 演进史(六):揭开 Tokenizer 的神秘面纱
7月4日
LLM演进史(五):构筑自注意力之路——从Transformer到GPT的语言模型未来
3月20日
微调之道
3月15日
LLM演进史(四):WaveNet——序列模型的卷积革新
3月9日
LLM演进史(三):批归一化——激活与梯度的统计调和
2月29日
GPT的现状
2月18日
LLM演进史(二):词嵌入——多层感知器与语言的深层连接
2月17日
LLM演进史(一):Bigram的简洁之道
2月17日
从0实现一个极简的自动微分框架
2月16日
Cherno-CPP-Notes
2月16日
CHSI-Converter
2月12日
2023
Turning 21
12月1日
此博客数据所有权由区块链加密技术和智能合约保障仅归创作者所有。
区块链标识
#61009
所有者
0x6380302480224d53ec4c2c318d1c7be2c55a7582
交易哈希
创作 0xe99aa0c3...eadd5b56dd
最后更新 0x183e93de...ca7c86d2ef
IPFS 地址
ipfs://bafkreid6e67datddz2iqadcmnro7m7dkhq3ocwp24mfkybtupiznpzoy7y