Assessing the Effectiveness of Residual Information in Scalable Image Coding for Humans and Machines (視聴と画像認識のための階層画像符号化における残差情報の活用とその有効性の検証)

Jul 29, 2025·
Yui Tatsumi
Yui Tatsumi
,
Ziyue Zeng
,
Hiroshi Watanabe
· 0 min read
Abstract
近年,視聴と画像認識の両方に対応する階層型画像符号化技術の需要が高まっている.従来手法ICMH-FF は,認識用と視聴用の二つのモデルをデコーダ側で接続することで,階層化を実現した.本稿では,それぞれ特徴量と画像の残差情報を活用する,Feature Residual-based Scalable Coding(FR-ICMH)とPixel Residual-based Scalable Coding(PR-ICMH)の2 手法を提案する.さらに,残差活用の整合性向上のため,特徴量のコサイン類似度を用いた損失関数の導入を提案する.実験結果は,提案した二つの階層画像符号化手法の有効性を示す.また,提案した損失関数の導入による明確な性能改善はない一方で,残差活用の有効性の検証によりモデル軽量化の可能性が示される.
Type
Publication
In The 28th Meeting on Image Recognition and Understanding