为何average pooling比Q - former结构更好?

1个回答

写回答

竹子菌

2026-01-25 03:10

+ 关注

BLIP - 2采用Q - Former是由于将Image Encoder和LLM都冻结了,仅有Q - Former的参数会被训练更新,这种设计是合理的。而若使用MLP,就没有充足的训练参数。要是MLLM存在其他部分(像encoder或者LLM)参与训练更新,那么使用MLP就是合理的。

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号