객체인식(Object Detection)

객체의 정보

  • 레이블(분류)

  • 위치정보


객체 인식 단계

  • 이미지 분류
    • 오브젝트가 1개만 있다면, 이미지 분류가 오브젝트 인식이다.

  • 객체 위치인식: 오브젝트인식

  • 객체 검출: 오브젝트 디텍션, 사각형(경계상자, b-box)
    • 하나의 이미지에 여러개의 객체가 있는 경우

  • 이미지분할: 세그멘테이션, 영역(픽셀단위)


CNN구조

  • 필터링(컨벌루션, 풀링) + 분류

  • [필터링 + 분류] 모델을 재사용하자.
    • [필터링 + 검출] 로 사용해보자. (전이학습)



객체 위치인식

  • 이미지 분류에서 '위치정보'가 추가된 것이다.

  • head = 분류 + 위치인식


위치값

  • 코코포맷: 시작점(좌측상단), 가로, 세로

  • 욜로포맷: 시작점(정중앙), 가로, 세로

  • 파스칼: 시작점(좌측상단), 끝점(우측하단)

위치의 절대값, 상대값 표현


객체인식 방법론

  • 객체 검출(Object Detection)
    • 2 stage: R-CNN
    • 1 stage: YOLO

  • 이미지 분할(Image Segmentation)
    • Semantic
      • U-Net
      • deeplap
    • Instance
      • Mask RCNN
      • YOLACT


댓글 쓰기

다음 이전