2019-03-07 14:58:14

 

ILSVRC은 ImageNet Large Scale Visual Recognition Challenge의 약자로 이미지 인식(image recognition) 경진대회이다. 여기서 이미지 인식과 이미지 분류(image classification)는 같은 의미를 갖는다. 대용량의 이미지셋을 주고 이미지 분류 알고리즘의 성능을 평가하는 대회이다. 2010년에 시작되었다. 이 대회에서 우승한 알고리즘들이 컴퓨터 비전 분야 발전에 큰 역할을 해왔다. 이른바 대세 알고리즘들이 되었다.  

 

2010년, 2011년에 우승을 차지한 알고리즘들은 얕은 구조(shallow architecture)를 가진 것들이었다. 얕은 구조를 가진 알고리즘에서는 이미지 인식에 유용할만한 특성들을 개발자들이 임의로 결정해서 도출했다. 그러나 2012년 CNN 기반 딥러닝 알고리즘 AlexNet이 우승을 차지한 이후에는 깊은 구조(deep architecture)를 가진 알고리즘들이 우승을 차지했다. AlexNet은 약 26%였던 인식 오류율을 16%까지 낮췄다. 10%를 낮춘다는 것은 상상하기도 힘든 일이었다. 얕은 구조 기반 알고리즘들로는 0.1% 낮추는 것도 쉽지 않았기 때문이다. 

 

딥러닝 기반 알고리즘이 사용되면서 인식 오류는 확실하게 낮아졌다. 심지어 2015년에는 사람의 정확도라고 알려진 5%를 추월했다. 2017년의 SENet의 경우 2.3%로 사람의 인식 에러율의 절반도 안된다. 

 

그림1. ILSVRC 대회 역대 우승 알고리즘들과 인식 에러율.

 

 

역대 우승 알고리즘은 다음과 같다(그림1 참고). 

2010 - NEC-UIUC (Lin et al.)

2011 - XRCE (Florent Perronnin, Jorge Sanchez) 

2012 - AlexNet

2013 - ZFNet

2014 - 우승 GoogLeNet, 준우승 VGGNet (VGGNet이 준우승을 하긴 했지만, 구조의 간결함과 사용의 편이성으로 인해 GoogLeNet보다 더 각광받았다.)

2015 - ResNet

2016 - GoogLeNet-v4

2017 - SENet

 

AlexNet, GoogLeNet, VGGNet, ResNet, SeNet에 대한 소개는 링크들을 참고해주세요.^^

 

AlexNet => https://bskyvision.com/421 

GoogLeNet => https://bskyvision.com/539 

VGGNet => https://bskyvision.com/504

ResNet => https://bskyvision.com/644

SENet => https://bskyvision.com/640 

 

 

<참고자료>

[1] https://www.statista.com/statistics/808190/worldwide-large-scale-visual-recognition-challenge-error-rates/

[2] http://research.sualab.com/introduction/2017/10/10/what-is-deep-learning-2.html 

[3] https://www.sohu.com/a/161633191_465975/?pvid=000115_3w_a