최근 수정 시각 : 2024-03-25 01:48:23

컴퓨터 비전

머신 비전에서 넘어옴

[[컴퓨터공학|컴퓨터 과학 & 공학
Computer Science & Engineering
]]
[ 펼치기 · 접기 ]
||<tablebgcolor=#fff,#1c1d1f><tablecolor=#373a3c,#ddd><colbgcolor=#0066DC><colcolor=white> 기반 학문 || 수학( 해석학 · 이산수학 · 수리논리학 · 선형대수학 · 미적분학 · 미분방정식 · 대수학( 환론 · 범주론) · 정수론) · 이론 컴퓨터 과학 · 암호학 · 전자공학 · 언어학( 형태론 · 통사론 · 의미론 · 화용론 · 음운론) · 인지과학 ||
하드웨어 구성 SoC · CPU · GPU( 그래픽 카드 · GPGPU) · ROM · RAM · SSD · HDD · 참조: 틀:컴퓨터 부품
기술 기계어 · 어셈블리어 · C/ C++ · C# · Java · Python · BIOS · 절차적 프로그래밍 · 객체 지향 프로그래밍 · 해킹 · ROT13 · 일회용 비밀번호 · 사물인터넷 · 와이파이 · GPS · 임베디드 · 인공신경망 · OpenGL · EXIF · 마이크로아키텍처 · ACPI · UEFI · NERF · gRPC · 리버스 엔지니어링 · HCI · UI · UX · 대역폭 · DBMS · NoSQL · 해시( SHA · 브루트 포스 · 레인보우 테이블 · salt · 암호화폐) · RSA 암호화 · 하드웨어 가속
연구

기타
논리 회로( 보수기 · 가산기 · 논리 연산 · 불 대수 · 플립플롭) · 정보이론 · 임베디드 시스템 · 운영 체제 · 데이터베이스 · 프로그래밍 언어{ 컴파일러( 어셈블러 · JIT) · 인터프리터 · 유형 이론 · 파싱 · 링커 · 난해한 프로그래밍 언어} · 메타데이터 · 기계학습 · 빅데이터 · 폰노이만 구조 · 양자컴퓨터 · 행위자 모델 · 인코딩( 유니코드 · MBCS) · 네트워크 · 컴퓨터 보안 · OCR · 슈퍼컴퓨터 · 튜링 머신 · FPGA · 딥러닝 · 컴퓨터 구조론 · 컴퓨터 비전 · 컴퓨터 그래픽스 · 인공지능 · 시간 복잡도( 최적화) · 소프트웨어 개발 방법론 · 디자인 패턴 · 정보처리이론 · 재귀 이론 · 자연어 처리( 기계 번역 · 음성인식) · 버전 ( 버전 관리 시스템 · Git · GitHub)


1. 개요2. 인공지능 모델3. 사용 예4. 관련 문서5. 관련 기업6. 관련 인물

1. 개요

computer vision

컴퓨터 공학의 한 분야로 컴퓨터로 시각(vision) 데이터를 처리하는 분야이다. 카메라와 센서가 인간의 눈의 기능을 한다면, 컴퓨터 비전은 이 시각 데이터를 처리하는 인지능력이다. 경찰학적으로는 사람의 얼굴을 인식하여 신원 데이터를 조회하는 기술로 응용되며, 군사적으로는 피아식별을 통해 사살해야 하는 대상을 찾아내고, 생태학적으로는 야생동물의 이동경로를 추적하거나, 의학적으로는 영상의학과 원격 수술에 응용되고 있다.

컴퓨터 비전은 영상 처리와 패턴 인식을 포함하는 분야로, 2D 벡터를 사용하여 이미지 데이터를 표현하고 분석한다. 이미지의 각 픽셀을 2D 벡터로 표현하고, 영상 처리 기법을 적용하여 이미지를 조작하고 분석한다. 또한, 2D 벡터 기반의 기계 학습 알고리즘을 사용하여 패턴 인식 문제를 해결하는 데에도 활용된다.

2. 인공지능 모델

  • CNN : 컨볼루션 신경망. 2012년 인공지능 학회에서 처음으로 발표된 내용이며 반박의 여지가 없는 인공지능 혁명의 시작을 알리는 알고리즘이자 컴퓨터 비전의 핵심이 되는 알고리즘이다. 딥러닝을 공부하게 되면 제일 처음으로 접하게 되는 신경망이자 지금도 그 중요도가 매우 높은 알고리즘으로 대우받고 있다. 실제 아래에 설명한 분야들은 다 이 알고리즘을 활용한 분야이다.
    • classification : 이미지가 무슨 이미지인지 분류하는 일이다. 고양이 사진을 고양이라고 판단하는 것과 같다.
    • object detection : 이미지에 물체가 어디에 있는지 네모 박스를 치는 일이다. 고양이 사진에서 고양이 부분에 네모난 영역을 치는 것과 같다.
    • semantic segmentation : 이미지에 물체가 무엇인지 픽셀 단위로 분류하는 일이다. 고양이 사진에서 고양이 부분을 떠내는 것과 같다. 이 때 고양이가 2마리여도 둘 다 고양이라고 판단한다.
    • instance segmentation : 이미지에 물체가 어디에 있는지 픽셀 단위로 판단하는 일이다. 고양이 사진에서 고양이 부분을 떠내되, 고양이마다 다르게 분류해야 한다. 즉, 2마리의 고양이는 서로 달라야 한다.
  • self-supervised Learning
  • GAN
  • autoencoder
  • VAE
  • flow-based model
  • diffusion model
  • score based model
  • NeRF
  • super resolution

3. 사용 예

  • 손글씨 인식
  • 얼굴 및 물체 인식
    • 가장 흔히 볼 수 있는 컴퓨터 비전. 휴대폰 카메라로 할 수 있는 QR 코드/바코드 스캐닝, 페이스북의 얼굴 인식 등, 생각보다 많은 일상생활 분야에 사용된다. 아이폰의 Face ID 또한 적외선 카메라를 이용한 보안성 높은 얼굴 인식이다.
  • 모션 트래킹
    • 광학식 모션 캡쳐, 립모션을 이용한 손의 움직임 감지, 오큘러스 퀘스트의 외부 적외선 카메라를 이용한 손 움직임 감지 등 영상정보로부터 관절의 위치를 역산하여 움직임을 구현한다.
  • 시각적 주행 측정[1]과 광학 흐름 (optical flow) [2]
  • 자율주행 자동차[3]

4. 관련 문서

5. 관련 기업

  • 링크제니시스: 링크제니시스 사의 VLAD 솔루션은 컴퓨터 비전의 영역으로 AI 를 활용한 이미지 검사를 수행하여 기존 비전 검사 대비 과검률을 높안 솔루션을 제공한다.

6. 관련 인물



[1] 카메라가 탑재된 기계가 찍는 사진들로 기계 자신의 이동과 회전을 측정하는 기술 [2] 광학 컴퓨터 마우스가 이 기술을 사용해서 움직임을 측정한다. 아랫쪽에서 나오는 빨간 빛과 관련이 있다. [3] LiDAR가 아닌 카메라로 주변 환경을 감지하는 경우. 테슬라가 대표적이다.