2026-01-25 03:10
BLIP - 2采用Q - Former是由于将Image Encoder和LLM都冻结了,仅有Q - Former的参数会被训练更新,这种设计是合理的。而若使用MLP,就没有充足的训练参数。要是MLLM存在其他部分(像encoder或者LLM)参与训练更新,那么使用MLP就是合理的。
关于我们|免责条款|版权声明|侵权举报|隐私政策|联系我们
Copyright © 2025 IZhiDa.com All Rights Reserved.
知答 版权所有 粤ICP备2023042255号