下一图集
通知 | 事关今冬供暖!一定记住!
思索到效率,我们采取了将跨模态 HRR block 和 transformer block 混合的网络结构。只应用比较浅(1-3层)的 HRR 对多模态表征中止高阶融合,然后应用 transformer 层中止 task specific adaptation。我们实验了不同的混合战略(见下图,从左到右)分别对应 early fusion/intermediate fusion/late fusion. [查看原文]
<< 上一图集
下一图集 >>