목차
1. 시각적 인지
시각은 세계를 이해하기 위한 한 가지 수단이다.
인지란 단순히 보는 것이 아니다. 실질적인 인식을 했을 때 인지라고 한다.
시각적 인지란 시야나 시각적 입력으로 패턴을 관찰하여 주변을 실질적으로 인식하는 시스템이다.
2. 비전 vision
시각적 정보를 인식하고 해석하는 능력
3. 컴퓨터 비전 computer vision
컴퓨터 비전이란 인공지능 시스템의 시각적인지를 다루는 분야로, 인공지능이 이미지와 영상을 이용해 내가 처한 환경을 인식하고 조치하는 과정을 연구한다.
4. 비전 시스템
4-1 사람의 시각 시스템
사람의 시각 시스템은 눈과 뇌이다. 눈은 이미지를 받아들이는 시각 센서이고, 뇌에서 그 이미지를 해석하고 결과를 도출해낸다.
그런데 뇌는 어떻게 이미지를 해석할까?
과거로부터의 경험이다. 경험은 곧 학습이 된다.
4-2 인공지능의 비전 시스템
인공지능의 비전 시스템 연구는 인간의 시각 시스템에 착안하여 시작됐다.
인간의 시각 능력을 머신으로 복제하는 것이다.
사람의 시각 시스템(눈, 뇌)을 흉내 내는 것이다.
눈의 역할을 하는 감지 장치, 뇌의 기능을 하는 이미지 해석과 분류를 맡는 알고리즘으로 구성된다.
4-2-1 감지 장치
주변 환경을 잘 파악할 수 있는 감지 장치
-라이다: 레이저 빛(Light Pulse)이 반사되어 돌아오는 정보로 주변 환경을 3차원 지도로 제공 다른 센서보다 넓은 시야 확보
-카메라: 카메라(camera) 센서 빛을 이용하여 물체의 형태와 색깔을 감지함. 교통 표지판 인식과 차선 이탈 경고 등을 위해 사용 밝은 곳에서만 사용 가능
-레이다: 빛이나 소리 대신 전파를 이용 좁은 범위의 물체를 인식, 보행자 탐지, 충돌 방지, 긴급 제동, 측면 접근 차량 알림을 위해 사용 어두운 곳에서도 작동하지만 물체의 형태와 색깔 은 감지하지 못함.
4-2-2 해석 장치
감지 장치에서 출력한 이미지로 사물을 인식할 수 있는 특징과 패턴을 학습해야 한다.
아래는 인간의 뉴런과 인공 뉴런(이것이 바로 인공 신경망이다. artificial neural network ANN)이다.
뉴런이 주 처리 단위 역할을 하며 입력 신호를 받고, 출력을 보낸다.
입력 신호가 일정 이상 활성호되면, 자신과 연결된 모든 뉴런에 신호를 일으킨다.
이런 뉴런을 수백만 개를 모아 서로 연결하고 층을 구성하면서 학습 능력을 높인다.
여러 층을 가진 신경망이 바로, 딥러닝 deep learning이다.
5. 컴퓨터 비전 응용 분야
이미지 분류 image classification : 폐암 진단, 교통 표지판 인식
객체 탐지image detection : 사물 탐지와 위치 인식
화풍 모방 neural style transfer
이미지 생성 generative adversarial network GNN
안면인식 face recognition
이미지 추천 시스템
6. 컴퓨터 비전 파이프라인
'머신러닝 > CNN' 카테고리의 다른 글
cifar10 데이터 이용한 CNN 모델 설계 2 (0) | 2023.04.15 |
---|---|
cifar10 데이터 이용한 CNN 모델 설계 1 (0) | 2023.03.11 |