视觉效果不错时,图像质量评估有何新方向?

1个回答

写回答

bb白白

2026-01-06 15:30

+ 关注

要是视觉效果还可以的话,其实能够考虑做真实世界超分辨率(real - world SR)。此外,还能加入一些无参考指标(non - reference metric),从别的角度来对生成图片的质量进行评估。实际上,个人比较建议不要再只做传统的超分辨率(SR),那种只在几个基准(benchmark)上刷榜的做法,在如今的大审稿环境下是完全没有好处的,很容易被审稿人(reviewer)批评工作是渐进式(incremental)的,然后拒稿,至少也要加入一些真实世界超分辨率设定下的比较。而且,现在的主流方法都是基于扩散模型(diffusion model)来做了,审稿人也开始要求关注一些生成方面的指标,例如FID、CLIP分数等,同时还有像Q - Align这样的无参考指标。像前几年那样只把PSNR、SSIM、LPIPS刷高的工作,现在学界(community)估计是不认可的。顺便吐槽一下低级视觉(low - level vision)的评估问题。之前和相关方向的朋友交流过,基本上大家都表示,把PSNR、SSIM这类传统指标刷高之后,模型更倾向于生成过度平滑(over - smoothed)的结果,这并不代表模型恢复出来的图像主观质量就很高。真正在做定性比较(qualitative comparison)的时候还是要人工挑选图片,其他指标或多或少都存在类似的不匹配问题,甚至有些还对超参数比较敏感,调参过程有时候近乎玄学。但是低级视觉这个领域又是执着于最先进性能(SOTA性能)的,拿不到最先进性能基本上就意味着没有投稿的资格。所以如果能有不错的视觉效果,至少先保证主观方面的性能,再耐心把模型分数刷高就可以了,这样不用陷入进退两难的境地,或许也能算是一个不错的进展了。

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号