root@bskyvision: ~#
방명록
태그
RSS

<닫기>

3,585,689/3,798/893

프로필사진
수많은 소음 속에서 신호를 찾아가는 bskyvision입니다.


<닫기>

  • leon_choi이(가) 08.10에 작성한 댓글: 멋쟁이.
  • 꼬장이이(가) 07.25에 작성한 댓글: test.

<닫기>

(이미지 분류) 검색 결과 9건
  • [python] 쉽고 간단하게 마스크 착용 유무 판별기 만들기 (94)
    저는 오늘 마스크 착용 유무 판별기를 만들어보려고 합니다. 객체 검출(object detection)의 방법으로 만들 수도 있겠지만, 그렇게 하면 데이터셋을 준비하는 데 꽤 큰 노력을 들여야합니다. 이미지들에서 마스크 쓴 얼굴과 마스크를 쓰지 않은 얼굴을 labelImg와 같은 라벨링 툴로 일일이 라벨링을 해줘야하기 때문입니다. 라벨링을 한다는 것은 이미지에서 마스크 쓴 얼굴과 마스크를 쓰지 얼굴을 모두 찾아서 거기에 바운딩 박스(bounding box)를 그려준 후에, 마스크를 쓰지 않은 얼굴에 0, 마스크를 쓴 얼굴에 1 이런식으로 라벨을 부여하는 것을 의미합니다. 이게 꽤 많은 시간을 들여야 하는 작업입니다. 그래서 좀 더 쉽고 간단하게 마스크 착용 유무 판별기를 만들 수 없나 고민하다가 택한 방법..
  • [python] 미리 훈련된 MobileNet으로 이미지 분류하기
    이미지넷으로 미리 훈련된 MobileNet으로 이미지를 분류해보도록 하겠습니다. MobileNet은 다른 이미지 분류 CNN 모델에 비해 적은 가중치들(weights)을 갖고 있습니다. 비교적 가벼운 모델이죠. 그럼에도 불구하고 분류 정확도에 있어서는 무거운 모델들과 비교했을 때 크게 뒤쳐지지 않습니다. 다음과 같은 신호등 이미지를 잘 분류해내는지 확인해볼까요? 다음 코드를 실행하시면 됩니다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 import numpy as np from tensorflow.keras.applications.mobilenet import MobileNet, preprocess_input, decode_predictions from tensorflow.keras.pr..
  • [Anaconda+python] 미리 훈련된 ResNet50으로 이미지 분류하기
    오늘은 거대한 데이터셋인 이미지넷에서 미리 훈련된 ResNet50을 이용해서 이미지 분류를 시행해보도록 하겠습니다. ResNet은 2015년 이미지넷경진 대회에서 우승을 차지한 이미지 분류 모델입니다. ResNet50은 ResNet 중에서 50개의 층을 갖는 하나의 모델입니다. 이미지넷과 같이 아주 큰 데이터셋을 이용해서 직접 이미지 분류기를 훈련시키는 것은 쉽지 않습니다. 상당히 많은 시간이 소요되기 때문입니다. 공대생들이 소장하고 있는 고성능의 랩탑이나 데스트탑을 이용한다고 해도 보름 이상은 걸릴 일입니다. 그래서 보통은 이미지넷에 훈련된 모델을 가지고 와서, 그것을 각자의 목적에 맞게 업그레이드시켜서 사용합니다. 좀 더 자세히 말한다면, 훈련된 가중치들을 가지고 와서 그 가중치들을 목적에 맞게 새롭..
  • [CNN 알고리즘들] SENet의 구조 (4)
    LeNet-5 => https://bskyvision.com/418 AlexNet => https://bskyvision.com/421 VGG-F, VGG-M, VGG-S => https://bskyvision.com/420 VGG-16, VGG-19 => https://bskyvision.com/504 GoogLeNet(inception v1) => https://bskyvision.com/539 ResNet => https://bskyvision.com/644 SENet => https://bskyvision.com/640 ----- 오랜만에 CNN 알고리즘에 대한 글을 쓰네요. 오늘은 SENet 차례입니다. SENet은 2017년 이미지넷 대회에서 우승을 차지한 모델입니다. top-5 error가 ..
  • [CNN 알고리즘들] ResNet의 구조 (18)
    LeNet-5 => https://bskyvision.com/418 AlexNet => https://bskyvision.com/421 VGG-F, VGG-M, VGG-S => https://bskyvision.com/420 VGG-16, VGG-19 => https://bskyvision.com/504 GoogLeNet(inception v1) => https://bskyvision.com/539 ResNet => https://bskyvision.com/644 SENet => https://bskyvision.com/640 오늘은 2015년 ILSVRC에서 우승을 차지한 ResNet에 대해서 소개하려고 한다. 오랜만에 이미지 분류용 CNN 모델에 대해 글을 쓰는 것 같다. ResNet은 마이크로소프트..
  • image classification과 fine-grained image classification의 차이
    image classification은 이미지가 개에 관한 것인지, 고양이에 관한 것인지, 사람에 관한 것인지, 자동차에 관한 것인지 분류하는 컴퓨터 비전 과제다. 그렇다면 fine-grained image classification은 무엇일까? 새의 종, 꽃의 종, 동물의 종 또는 자동차의 모델 같이 구분하기 어려운 클래스들을 분류하는 과제다. 사람에게는 image classification보다 당연히 좀 더 어려운 과제이다. 직관적으로 생각해도 자동차와 꽃을 분류하는 것보다 참새인지, 독수리인지, 앵무새인지를 구분하는 것이 좀 더 어려울 것이다. 왜냐하면 비슷하게 생겼기 때문이다. 얼마 전에 아는 형님의 남자 아이와 통화를 하는데 자동차가 어떤 브랜드인지 무슨 모델인지에 대해서 너무나 잘 분류해내는 ..
  • [CNN 알고리즘들] GoogLeNet(inception v1)의 구조 (11)
    LeNet-5 => https://bskyvision.com/418 AlexNet => https://bskyvision.com/421 VGG-F, VGG-M, VGG-S => https://bskyvision.com/420 VGG-16, VGG-19 => https://bskyvision.com/504 GoogLeNet(inception v1) => https://bskyvision.com/539 ResNet => https://bskyvision.com/644 SENet => https://bskyvision.com/640 ----- CNN 알고리즘들을 계속해서 포스팅하고 있다. LeNet-5, AlexNet, VGG-F, VGG-M, VGG-S, VGG16, VGG19에 이어서 오늘은 GoogLeN..
  • 이미지 분류 모델 평가에 사용되는 top-5 error와 top-1 error (11)
    딥러닝 관련 논문을 보다보면 실험 평가 부분에서 top-5 error와 top-1 error라는 용어들을 심심찮게 발견하게 된다. top-5 error와 top-1 error는 이미지 분류(image classification) 성능을 평가하기 위한 것들이다. 훈련이 된 분류기(classifier)는 주어진 테스트 이미지가 어떤 클래스에 속하는지 분류해낼 것이다. {고양이, 강아지, 집, 축구공, 사자}와 같이 5개의 클래스 라벨을 가지고 훈련된 분류기가 있다고 가정해보자. 새로운 이미지를 이 분류기에 입력해줬는데, 0.1, 0.6, 0.05, 0.05, 0.2와 같은 결과를 냈다. 새로운 이미지가 강아지일 확률이 가장 높다고 판단한 것이다. 이때 top-1 class는 {강아지}가 된다. 그리고 top..
  • 이미지 분류(image classification)와 물체 검출(object detection)의 차이는? (4)
    새로운 분야의 언어는 항상 낯설다. 처음 영상 처리 분야의 논문을 읽기 시작했을 때 많은 단어들은 나에게 외계어와 같았다. 영어라서 장벽이 있었던 것도 사실이지만, 그보다 더 큰 문제는 사전을 찾아서 뜻은 알아도 도대체 이 단어가 무엇을 의미하는 것인지 제대로 알기 힘든 경우가 많았다. 나같은 공대생에게 "current"라는 단어를 제시하면 "전류"가 먼저 생각날 것이다. 하지만 문과생에게는 "현재의, 지금의"라는 뜻으로 보일 가능성이 높다. 그러니까 어느 정도 그 분야에 대한 선지식이 없으면 영어를 잘해도 해석을 쉽사리 해내지 못한다. 컴퓨터 비전 및 딥러닝 분야를 처음 접하는 사람들에게도 이런 경험이 많이 있을 것이다. 이미지 분류(image classification), 이미지 인식(image re..