Nagi-ovo
追蹤
Breezing homepage: nagi.fun
164
粉絲
19
追蹤中
贊助
主页
封存
作品集
日寄
友链
多模态
最新
熱門
最多留言
以 Paligemma 为例的视觉语言模型
视觉语言模型可以分为四类^{[1]}: 将图像转为可以和文本 token 共同训练的嵌入特征,如 VisualBERT、SimVLM、CM3 and etc. 学习良好的图像嵌入,作为冻结的预训练预言模型的前缀,如 ClipCap 通过专门涉及的 cross-attention…
深度学习
12 分鐘
16 天前
此部落格數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。
區塊鏈編號
#61009
擁有者
0x6380302480224d53ec4c2c318d1c7be2c55a7582
交易雜湊值
創作 0xe99aa0c3...eadd5b56dd
最後更新 0x5e6c1cbc...422856f4e3
IPFS 位址
ipfs://QmNMspsYnpWWJMUaMwuEDV5rXHnfh4hPH13KoneGX6oUnt