본문 바로가기

AI

[AI] AI 모델 (PointNet, VoteNet, PointRCNN, YOLO)

728x90

AI 모델에는 제목에서 알 수 있듯이 다양한 종류가 존재한다.

 

 

먼저 PointNet이다.

 

PointNet은 input으로 Point cloud를 직접적으로 다룬 딥러닝 모델이다.

 

여기서 말하고 있는 포인트 클라우드 개념은 지난 글에서 다루었으니, 링크로 달아두겠습니다.

https://binaryroot.tistory.com/2

 

[AI] 자율주행부터 스마트시티까지 AI와 라이다

포인트 클라우드 데이터와 AI AI와 LiDAR를 결합해 최신 기술 트렌드를 공부하고 응용을 목표로 두고 공부를 시작한다. LiDAR 센서의 원리LiDAR(라이다) = Light Detection and Ranging레이저를 사용해서 사물

binaryroot.tistory.com

 

PointNet

PointNet은 위와 같은 구조로 되어있다.

 

PointNet은 다음과 같이 세 가지 특성을 가진다.

  • Unordered (순서X)
  • Interaction among points (포인트 간 상호작용)
  • Invariance under transformations (변환 시 불변성)

 

VoteNet

 

VoteNet은 2D 탐지기의 도움 없이 포인트 클라우드를 직접 처리하여 3D 객체를 탐지하는 모델이라고 한다.

VoteNet의 아키텍처 구조

 

VoteNet의 문제점

 

 

 

 

PointRCNN

 

PointRCNN은 3D 객체 탐지를 위한 혁신적인 딥러닝 모델이다.

PointRCNN은 자율주행차나 로봇공학 등에서 중요하게 사용되는 기술이다.

PointRCNN

PointRCNN은 자율주행과 보안 분야에서 중요한 역할을 한다.

 

자율주행에서의 활용

  • LiDAR 센서 데이터 처리
    : LiDAR 센서가 생성하는 3D 포인트 클라우드 직접 처리 가능
  • 정확한 object 탐지
    : 도로 위의 차량, 보행자, 자전거 등을 정확하게 탐지하여 안전한 주행 지원
  • 실시간 처리 가능
    : 2단계 구조를 통하여 효율적인 3D 객체 탐지 가능

보안 분야에서의 활용

  • 3D 감시 시스템
    : 복잡한 3D 환경에서 객체를 정확히 탐지하여
    보안 감시 능력 향상
  • 이상 행동 감지
    : 3D 공간에서의 객체 움직임을 분석하여 잠재적 위협 식별 가능

PointRCNN의 높은 정확도와 효율성을 통하여 자율주행 기술의 안전성을 높이고,

보안 시스템의 성능을 향상시키는 데 기여 할 수 있다.

PointRCNN은 KITTI 데이터셋에서 쓰이고 있으며,
실제 도로 환경에서의 적용 가능성도 보여주고 있다.

KITTI 데이터셋의 예

 

YOLO

 

YOLO는 You Only Look Once 의 약자이고,

이름에서 볼 수 있듯이 이미지를 한 번 보고 object detection을 수행하는 것을 말한다.

 

YOLO 모델의 동작과정은 아래와 같다.

  1. 이미지를 보면 고정 사이즈로 resizing을 하여
    동일 사이즈로 만든다.
  2. 1번에서 완료한 이미지를 CNN에 넣는다.
  3. 2번에서 나온 출력물은
    S x S Grid Cell로 나누고
    Grid Cell 별로 B개의 Bounding Box 예측

YOLO 모델의 최종 Output은 아래와 같다.

S x S x (5 * B + C)     

(5: bounding box 하나에 매핑되는 정보이며 x,y,w,h,confidence의 5개의 벡터를 말함.)

 

 

 

 

 

 

아직 공부중에 있긴 하지만,

내용 자체가 인터넷에 나와있는 정보의 양이 많지 않다보니

공부를 어떻게 해야할지 막막하다.

728x90