为何average pooling比Q - former结构更好？

1个回答

竹子菌

2026-01-25 03:10

BLIP - 2采用Q - Former是由于将Image Encoder和LLM都冻结了，仅有Q - Former的参数会被训练更新，这种设计是合理的。而若使用MLP，就没有充足的训练参数。要是MLLM存在其他部分（像encoder或者LLM）参与训练更新，那么使用MLP就是合理的。

举报有用（0）分享收藏

相关问题

关于我们|免责条款|版权声明|侵权举报|隐私政策|联系我们

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答版权所有粤ICP备2023042255号