728x90

공부/컴퓨터비전, 영상처리 63

이미지에서 노이즈 제거하는 디노이징 알고리즘, NLmeans 설명 (python 코드 포함)

가장 간단하게 이미지에서 노이즈를 제거하는 방법은 예전에 소개해드렸던 Gaussian 필터, Median 필터, Bilateral 필터를 사용하는 것입니다. Gaussian, Median, Bilateral 필터 처리는 모두 이웃한 주변 픽셀들의 값을 가지고 현재 픽셀의 값을 바꿔준다는 특징을 갖고 있습니다. 예를 들어, Median 필터는 현재 픽셀의 주변 이웃들의 중앙값(median)을 구해서 그것을 현재 픽셀의 값으로 삼아줍니다. 그런데 이러한 Gaussian, Median, Bilateral 필터처리를 이용해서 노이즈를 제거하는 것은 한계가 많습니다. median 필터만 해도 salt-and-pepper와 같이 위치 상 떨어져 있는 픽셀들에 노이즈가 낀 경우에만 성공적일 뿐 노이즈가 여러 픽셀에 ..

얼굴 랜드마크(facial landmark)란?

랜드마크라는 단어는 모두들 익숙히 알고 있을 것입니다. 보통 어떤 지역을 대표하는 건물 또는 조형물 등을 랜드마크라고 부르죠. 예를 들어, 뉴욕의 경우 자유의 여신상, 파리는 에펠탑, 런던은 런던아이, 서울은 경복궁, 도쿄는 도쿄타워, 베이징은 만리장성 등을 랜드마크로 부를 수 있겠습니다. 그 지역의 랜드마크에 가서 사진 한 장 찍어야만, 우리는 보통 그 지역을 방문했다고 생각합니다. 그렇다면, 사람 얼굴에서 랜드마크로 생각할 수 있을 만한 것에는 무엇이 있을까요? 쉽게 말해서 얼굴에서 없으면 안 되는 것들이 바로 랜드마크입니다. 코, 눈, 입, 눈썹, 턱과 같은 것 중에 하나라도 없다면 일반적인 사람의 얼굴로 보기는 어렵겠죠. 따라서 코, 눈, 입, 눈썹, 턱선과 같은 것을 얼굴의 랜드마크라고 부를 수..

머리 자세 추정(head pose estimation)에서 pitch, roll, yaw angle이란?

자세 추정(pose estimation)은 말 그대로 포즈, 동작, 자세를 추정하는 연구 과제입니다. 그 중에서 머리 자세 추정(head pose estimation)은 머리의 자세를 추정합니다. 머리 자세 추정 연구 분야에 입문하려면 꼭 알아야 할 용어들이 있습니다. 바로 pitch angle, roll angle, yaw angle입니다. 머리의 회전과 관련된 용어들입니다. 사전을 찾아봐서는 이 단어들이 어떤 뜻인지 이해하기가 힘듭니다. 가장 쉽게 이것들을 이해할 수 있게 그려놓은 그림을 소개해드리겠습니다. 위 그림에 보이는 것처럼 pitch angle는 머리를 끄덕이는 것과 관련된 각도입니다. 또한 roll angle은 머리를 갸우뚱하는 각도입니다. 마지막으로 yaw angle은 머리를 도리도리하는..

동적 텍스처(dynamic texture) 분류란?

texture라는 것은 이미지 안에 있는 어떠한 질감이나 패턴을 의미합니다. 나무 사진만의 질감이 있고, 자갈밭의 사진에서 느낄 수 있는 질감이 있고, 하늘 사진이 주는 질감이 있죠. 각기 모두 다른 질감을 가지고 있습니다. 이러한 이미지들의 특징은 공간적으로 어떠한 패턴이 반복된다는 점입니다. 여기서 더 나아가서, 앞에 동적이란 말이 붙었을 때는 공간적으로뿐만 아니라 시간적으로도 특정한 질감이 반복 유지되는 텍스처를 의미한다고 보시면 됩니다. 이러한 이유로 동적 텍스쳐는 temporal texture라고 불리기도 합니다. 동적 텍스처를 가진 영상을 몇 개 예시로 보여드리겠습니다. 이러한 동적 텍스처를 분류하는 연구 과제도 있습니다. 일종의 이미지 분류 과제라고 볼 수 있습니다. 이 동영상이 폭포수에 관..

선형보간법(linear interpolation)과 삼차보간법(cubic interpolation), 제대로 이해하자

선형보간법(linear interpolation)에 대해서는 잘 설명된 자료가 많지만, 삼차보간법(cubic interpolation)에 대해서는 읽을 만한 괜찮은 자료를 찾기가 쉽지 않습니다. 아마도 삼차보간법에 대해 글을 쓰신 분들도 완벽하게 원리를 이해하고 쓴 것이 아닌 것 같습니다. 아인슈타인이 이렇게 말했죠. "만약 당신이 무엇인가를 쉽게 설명할 수 없다면, 그것을 제대로 이해한 것이 아니다." 이 글이 삼차보간법과 쌍삼차보간법을 이해하는데 있어 여러분들께 통찰력을 제공하길 바랍니다. 우선 보간법(interpolation)이라는 것이 무엇인지 간략히 설명하고 넘어가겠습니다. 보간법이란 알려진 값을 가진 두 점 사이 어느 지점의 값이 얼마일지를 추정하는 기법을 의미합니다. 아래 그림을 보시면 a와..

지각(perception)과 인지(cognition)의 차이 이해하기

컴퓨터비전과 영상처리는 기본적으로 사람이 눈을 통해 본 것을 뇌가 어떻게 처리하는지를 모방하는 연구분야이기 때문에 사람의 눈과 뇌에 대해 이해하는 것은 매우 중요합니다. 그러다보니 해부학, 심리학, 신경과학, 인지과학 등과 관련된 논문도 종종 읽곤 합니다. 이 분야들 같은 경우 다른 것을 떠나서 용어가 너무 어렵습니다. 사전 찾아보기 바쁘다고 해야할까요. 오늘은 제가 자주 접했지만 정확하게 개념을 내리지 못했던 두 용어에 대해 정리하고자 합니다. 바로 지각(perception)과 인지(cognition)입니다. 저는 거의 두 단어를 혼용했는데, 분명히 차이가 있는 단어라는 것을 최근에야 알게 되었습니다. 지각은 주변 환경으로부터 받아들인 감각 정보를 식별하고 해석하는 것을 의미합니다. 즉, 지각이란 보거..

최소식별차(just-noticeable-difference)와 영상압축

안녕하세요. 비스카이비전입니다.^^ 오늘은 최소식별차가 무엇인지, 그것이 영상압축에 왜 활용이 가능한지에 대해 이야기하도록 하겠습니다. 우리가 감지할 수 있는 최소한의 차이를 최소식별차(JND, just-noticeable-difference)라고 부릅니다. 예를 들어, 초록색이 있고 그것보다 조금 더 진한 초록색이 있습니다. 너무 차이가 없으면 우리는 같은 색으로 인지합니다. 그런데 어느 정도 차이가 생기면 우리는 차이가 있다고 느낍니다. 딱 바로 차이를 느끼는 그 순간의 차이를 바로 JND라고 합니다. JND의 이해를 돕기 위해 다른 예를 하나 더 들어보겠습니다. 음식을 만들고 있습니다. 간이 맞지 않아서 소금을 더 넣었습니다. 그런데 차이가 느껴지지 않습니다. 그래서 소금을 좀 더 넣었습니다. 이제..

사람들이 자연 풍광 사진을 실내 및 도시 사진보다 선호하는 이유는?

대개 많은 사람들이 야외 자연 풍광 사진을 실내 사진 및 도시 사진보다 더 좋아합니다. 저도 그런 편입니다. 그런 자연 사진을 찍기 위해 많은 사람들이 해외로, 휴양지로 여행을 가기도 하죠. 왜 우리에게 그런 경향이 있는지, 그 이유에 대해 수많은 연구자들이 연구해왔습니다. 하나는 진화론적 관점에서의 분석입니다. 사람들은 오랜 기간동안 사람이 만든 건축물이 많지 않은, 즉 개발되지 않은 자연적 환경에서 살아왔고, 결과적으로 자연 풍광 이미지에 적응되도록 우리의 시각시스템이 진화해왔다는 것입니다. 또한 자연 사진이 실내, 도시에 비해 긴장을 푸는데 도움이 된다고 합니다. 그 이유로 뇌 속에 있는 스트레스를 경감시키는 역할을 하는 수용체(receptor)들이 자연 풍광 이미지를 볼 때 활성화되도록 진화해 온..

등방성(isotropic) 이미지와 이방성(anisotropic) 이미지란?

영상처리 관련 논문을 읽다보면 isotropic, anisotropic 두 단어를 종종 보곤 합니다. 두 단어는 서로 반의어입니다. isotropic anisotropic isotropic은 사전적으로 "등방성의"라는 뜻을 갖고, anisotropic은 "이방성의"라는 뜻을 지닙니다. 뜻을 풀어보면 등방성은 "같은 방향 성질을 갖는"이고, 이방성은 "다른 방향 성질을 갖는"이 됩니다. 이렇게 풀어봐도 전혀 이해가 안되죠. 이해가 안되는 것이 어쩌면 당연합니다. 일단 넘어가서, 영상처리 분야에서 이 단어들이 사용되는 경우에 대해 생각해보겠습니다. 등방성이 강한 이미지와 이방성이 강한 이미지는 어떤 이미지를 뜻하는 것일까요?? 특정 방향에 대한 정보를 다른 방향에 대한 정보보다 유독 더 많이 담고 있는 이미..

가상현실(VR) 영상 촬영부터 시청까지

3D 영상은 언젠가부터 종적을 감추고 있는 것 같습니다. 여전히 3D 영화가 출시되긴 하지만, 보는 사람이 그렇게 많지는 않은 것 같습니다. 2D 영상과 비교했을 때 현실감을 그렇게 높여주지 못하고, 도리어 머리가 아프거나 눈이 뻐근해지는 현상을 야기하기 때문입니다. 3D 영화를 볼 때 시각적으로 불편함을 느끼는 생물학적 이유는 이전 포스팅을 참고해주세요. 이러한 동향으로 인해 저희 연구실에서도 3D 관련된 연구는 점차적으로 손을 놓고 있고, 대신 가상현실(virtual reality)에 대한 연구를 약 3년 전부터 시작해서 현재까지 진행해오고 있습니다. 오늘은 VR 영상의 촬영부터 시청까지 과정을 간단히 정리해보려고 합니다. 대략 다음과 같은 7개의 과정을 거칩니다. 1) 촬영(shooting) 2) ..