Research/컴퓨터비전, 영상처리

[IQA] 2020년 현재 가장 큰 IQA 데이터베이스, KADID-10k (10,125장의 왜곡 이미지)

bskyvision.com 2020. 8. 14. 08:06

기존 IQA 데이터베이스들은 비교적 작았습니다. 가장 널리 활용되는 LIVE, CSIQ, TID2013이 각각 779장, 866장, 3000장의 왜곡 이미지를 제공하고 있었습니다. 비교적 큰 데이터베이스가 필요했던 상황에서 올해(2020년)에 새로운 IQA 데이터베이스가 나왔습니다. 바로, 이름은 KADID-10k입니다. 이름에서 대략 유추할 수 있듯이 KADID-10k는 10,125장의 왜곡 이미지를 제공합니다. 

 

KADID-10k의 왜곡 이미지들은 81개의 원본 이미지(pristine source image)로부터 만들어졌습니다. 원본 이미지의 갯수도 LIVE, CSIQ, TID2013에 비해서 많습니다. LIVE는 29장, CSIQ는 30장, TID2013은 25장의 원본 이미지를 갖고 있습니다. 전반적으로 KADID-10k 데이터베이스 내 원본 이미지들의 퀄리티가 LIVE, CSIQ, TID2013의 것들보다 낫습니다. 

 

KADID-10k의 원본 이미지들 모음

 

그리고 KADID-10k는 25개의 왜곡 유형을 포함합니다. 이 역시도 가장 많은 수치입니다. LIVE는 5개, CSIQ는 6개, TID2013은 24개의 왜곡 유형을 제공합니다. KADID-10k에서 제공하는 왜곡 유형들은 다음과 같습니다.

 

1. Gaussian blur

2. Lens blur

3. Motion blur

 

4. Color diffusion

5. Color shift

6. Color quantization

7. Color saturation1

8. Color saturation2

 

9. JPEG2000

10. JPEG

 

11. White noise

12. White noise in color component

13. Impulse noise

14. Multiplicative noise

15. Denoise

 

16. Brighten

17. Darken

18. Mean shift

 

19. Jitter

20. Non-eccentricity patch

21. Pixelate

22. Quantization

23. Color block

 

24. High sharpen

25. Contrast change

 

마지막으로, KADID-10k는 주관 평가 점수로 DMOS값을 제공합니다. 

 

LIVE, CSIQ, TID2013, KADID-10k에 대한 핵심 정보를 표로 요약해봤습니다. 

 

데이터베이스 #원본이미지 #왜곡이미지 #왜곡유형 라벨유형
LIVE 29 779 5 DMOS
CSIQ 30 866 6 DMOS
TID2013 25 3000 24 MOS
KADID-10k 81 10125 25 DMOS

 

 

b스카이비전의 추천글

[IQA] 2D 이미지 품질 평가 데이터베이스들: LIVE, CSIQ, TID2013