视觉效果不错时，图像质量评估有何新方向？

1个回答

bb白白

2026-01-06 15:30

要是视觉效果还可以的话，其实能够考虑做真实世界超分辨率（real - world SR）。此外，还能加入一些无参考指标（non - reference metric），从别的角度来对生成图片的质量进行评估。实际上，个人比较建议不要再只做传统的超分辨率（SR），那种只在几个基准（benchmark）上刷榜的做法，在如今的大审稿环境下是完全没有好处的，很容易被审稿人（reviewer）批评工作是渐进式（incremental）的，然后拒稿，至少也要加入一些真实世界超分辨率设定下的比较。而且，现在的主流方法都是基于扩散模型（diffusion model）来做了，审稿人也开始要求关注一些生成方面的指标，例如FID、CLIP分数等，同时还有像Q - Align这样的无参考指标。像前几年那样只把PSNR、SSIM、LPIPS刷高的工作，现在学界（community）估计是不认可的。顺便吐槽一下低级视觉（low - level vision）的评估问题。之前和相关方向的朋友交流过，基本上大家都表示，把PSNR、SSIM这类传统指标刷高之后，模型更倾向于生成过度平滑（over - smoothed）的结果，这并不代表模型恢复出来的图像主观质量就很高。真正在做定性比较（qualitative comparison）的时候还是要人工挑选图片，其他指标或多或少都存在类似的不匹配问题，甚至有些还对超参数比较敏感，调参过程有时候近乎玄学。但是低级视觉这个领域又是执着于最先进性能（SOTA性能）的，拿不到最先进性能基本上就意味着没有投稿的资格。所以如果能有不错的视觉效果，至少先保证主观方面的性能，再耐心把模型分数刷高就可以了，这样不用陷入进退两难的境地，或许也能算是一个不错的进展了。

举报有用（0）分享收藏

视觉效果不错时，图像质量评估有何新方向？

1个回答

bb白白

热门话题

相关问题