[IQA] 이미지 내 지배적인 구조가 왜곡되면 지각 품질이 나쁘다, DASM
안녕하세요. 비스카이비전의 심교훈입니다.^^ 오늘은 IQA 알고리즘 DASM을 소개하고자 합니다. 이 알고리즘은 서안 교통대학교의 Ding 등이 2017년에 TIP에 게재한 논문 "Image Quality Assessment Using Directional Anisotropy Structure Measurement"에서 소개되었습니다.
이 알고리즘은 사람의 시각 시스템(human visual system, HVS)은 사소한 질감(minor texture) 위에 있는 왜곡보다는 지배적인 구조(dominant structure) 위에 있는 왜곡에 훨씬 더 민감하다는 가설 위에 세워졌습니다. 그 지배적인 구조 정보를 도출하기 위해 저자들은 그레디언트, 이방성(anisotropy), 지역 방향성(local directionality)을 종합한 DASM 맵을 산출했습니다. DASM 맵은 사소한 질감들에서부터 지배적인 구조를 찾아내는데 이점을 가집니다. 그리고 원본 이미지 DASM과 왜곡 이미지 DASM 간의 지역 유사도를 평균냄으로써 최종 품질 점수를 얻었습니다.
DASM 맵이 그레디언트 크기로 구조를 도출한 것과 phase congruency(PC)로 구조를 도출한 것에 비해 지배적인 구조를 더 잘 담고 있는 것은 다음 그림을 통해 확인할 수 있습니다.
위 그림에 보이듯이 DASM 맵은 사소한 질감은 도출해내지 않고, 지배적인 구조만 도출해냅니다. 반면, 그레디언트 맵과 PC 맵은 지배적인 구조부터 사소한 질감까지 모두 도출해냅니다.
DASM의 성능을 확인해볼까요??
그레디언트맵과 평균 풀링을 사용하는 GSIM과 PC맵과 그레디언트맵을 사용하는 FSIM에 비해서는 CSIQ 데이터베이스에서 성능이 좋고 나머지에서는 비슷한 성능을 보입니다. 그레디언트맵과 평균 풀링을 사용하는 GMSD에 비해서는 전반적으로 비슷한 성능을 보입니다. 기존 방식보다 성능이 뛰어나다고 말하기는 어렵지만 새로운 접근법으로 IQA 문제를 해결하고자 했던 것을 높게 사 논문을 통과시킨 것이 아닌가 추측해봅니다.