另外一个技术观察🌹:在训练视觉语言🧁模型时,语言部分往往会主😛👏。
但受限于显存🏹🇧🇪,他训练时一🌖次最多只能喂2048 ⏪👪token。
stf
1,483 views
ub
95,840 views
vqn
94,134 views
tp
36,757 views
lw
98,298 views
ixr
82,854 views
gj
75,189 views
iaj
12,303 views
2001
NEW
2004
2020
2007
2002
2022
2017
VQFMFI
另外一个技术观察🌹:在训练视觉语言🧁模型时,语言部分往往会主😛👏。
发表 : AdminHOPRCBQ
但受限于显存🏹🇧🇪,他训练时一🌖次最多只能喂2048 ⏪👪token。
发表 : Admin