ILSVRC은 ImageNet Large Scale Visual Recognition Challenge의 약자로 이미지 인식(image recognition) 경진대회이다. 여기서 이미지 인식과 이미지 분류(image classification)는 같은 의미를 갖는다. 대용량의 이미지셋을 주고 이미지 분류 알고리즘의 성능을 평가하는 대회이다. 2010년에 시작되었다. 이 대회에서 우승한 알고리즘들이 컴퓨터 비전 분야 발전에 큰 역할을 해왔다. 이른바 대세 알고리즘들이 되었다.
2010년, 2011년에 우승을 차지한 알고리즘들은 얕은 구조(shallow architecture)를 가진 것들이었다. 얕은 구조를 가진 알고리즘에서는 이미지 인식에 유용할만한 특성들을 개발자들이 임의로 결정해서 도출했다. 그러나 2012년 CNN 기반 딥러닝 알고리즘 AlexNet이 우승을 차지한 이후에는 깊은 구조(deep architecture)를 가진 알고리즘들이 우승을 차지했다. AlexNet은 약 26%였던 인식 오류율을 16%까지 낮췄다. 10%를 낮춘다는 것은 상상하기도 힘든 일이었다. 얕은 구조 기반 알고리즘들로는 0.1% 낮추는 것도 쉽지 않았기 때문이다.
딥러닝 기반 알고리즘이 사용되면서 인식 오류는 확실하게 낮아졌다. 심지어 2015년에는 사람의 정확도라고 알려진 5%를 추월했다. 2017년의 SENet의 경우 2.3%로 사람의 인식 에러율의 절반도 안된다.
역대 우승 알고리즘은 다음과 같다(그림1 참고).
2010 - NEC-UIUC (Lin et al.)
2011 - XRCE (Florent Perronnin, Jorge Sanchez)
2012 - AlexNet
2013 - ZFNet
2014 - 우승 GoogLeNet, 준우승 VGGNet (VGGNet이 준우승을 하긴 했지만, 구조의 간결함과 사용의 편이성으로 인해 GoogLeNet보다 더 각광받았다.)
2015 - ResNet
2016 - GoogLeNet-v4
2017 - SENet
AlexNet, GoogLeNet, VGGNet, ResNet, SeNet에 대한 소개는 링크들을 참고해주세요.^^
AlexNet => https://bskyvision.com/421
GoogLeNet => https://bskyvision.com/539
VGGNet => https://bskyvision.com/504
ResNet => https://bskyvision.com/644
SENet => https://bskyvision.com/640
<참고자료>
[2] http://research.sualab.com/introduction/2017/10/10/what-is-deep-learning-2.html
[3] https://www.sohu.com/a/161633191_465975/?pvid=000115_3w_a
'Research > 컴퓨터비전, 영상처리' 카테고리의 다른 글
Bag of Words (BoW) 이해하기 (0) | 2019.04.17 |
---|---|
이미지 라벨링 툴 labelImg 사용 중 에러 해법 (0) | 2019.04.12 |
물체 검출 알고리즘 성능 평가방법 AP(Average Precision)의 이해 (67) | 2019.04.09 |
컴퓨터 비전 관련 대회들 정리 (2) | 2019.04.09 |
이미지 분류(image classification)와 물체 검출(object detection)의 차이는? (4) | 2019.03.01 |
[3D 비전] 양안 합, 차 채널은 무엇인가? (0) | 2019.02.28 |
JPEG2000 압축이 JPEG 압축보다 더 낫지만, 시장은 JPEG 압축을 선택했다 (2) | 2019.01.23 |
푸리에 변환과 웨이블릿 변환 비교 (26) | 2019.01.21 |