Nagi-ovo
追蹤
Breezing
136
粉絲
17
追蹤中
贊助
主页
封存
作品集
日寄
封存
標籤
深度学习
(10)
强化学习
(4)
MCTS
(1)
Self-Play
(1)
RL
(5)
PPO
(1)
知识蒸镏
(1)
Follow
(1)
actor-critic
(1)
AI
(10)
LoRA
(1)
PEFT
(1)
PyTorch
(2)
Triton
(2)
Deep Learning
(1)
Python
(1)
Policy Gradient
(1)
WSL
(1)
环境配置
(1)
LLM
(7)
Tokenizer
(1)
BPE
(1)
NLP
(1)
GPT
(1)
Transformer
(1)
微调
(1)
ChatGPT
(1)
词嵌入
(1)
祝你生日快乐
(1)
2024
Let's build AlphaZero
11月26日
“速通” PPO
11月13日
知识蒸馏入门学习
11月3日
破解 Follow 邀请码的历程
10月31日
Actor Critic 方法初探
10月10日
从 DQN 到 Policy Gradient
10月6日
强化学习基础与Q-Learning
10月2日
LoRA in PyTorch
10月1日
Vector Add in Triton
9月19日
Softmax in OpenAI Triton
9月14日
Policy Gradient 入门学习
9月12日
WSL2 配置 Ubuntu20.04
8月20日
LLM 演进史(六):揭开 Tokenizer 的神秘面纱
7月4日
LLM演进史(五):构筑自注意力之路——从Transformer到GPT的语言模型未来
3月20日
微调之道
3月15日
LLM演进史(四):WaveNet——序列模型的卷积革新
3月9日
LLM演进史(三):批归一化——激活与梯度的统计调和
2月29日
GPT的现状
2月18日
LLM演进史(二):词嵌入——多层感知器与语言的深层连接
2月17日
LLM演进史(一):Bigram的简洁之道
2月17日
从0实现一个极简的自动微分框架
2月16日
Cherno-CPP-Notes
2月16日
CHSI-Converter
2月12日
2023
Turning 21
12月1日
此部落格數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。
區塊鏈編號
#61009
擁有者
0x6380302480224d53ec4c2c318d1c7be2c55a7582
交易雜湊值
創作 0xe99aa0c3...eadd5b56dd
最後更新 0xa2a8e0fd...2a39597ebe
IPFS 位址
ipfs://bafkreib6guajxxyr7vuwfe24vb7ndto3kxbond4lbg3cpednsrpqpog3wy