R-CNN 영상 이미지 인식을 이용한 차량간 거리 추정
- 최초 등록일
- 2023.06.09
- 최종 저작일
- 2023.06
- 12페이지/ 한컴오피스
- 가격 2,500원
목차
1. 개요
2. 개발환경
3. 딥러닝 학습 과정
4. 차량 간 거리 추정
5. 시뮬레이션 결과
6. 결론
7. 참고문헌
본문내용
1. 개요
Term project에서 선정한 주제는 ‘R-CNN 영상 이미지 인식을 이용한 차량간 거리 추정’이다. R-CNN 딥러닝 기법은 object detection 분야에서 널리 사용되고 있는 기법으로 R-CNN, Fast R-CNN, Fater R-CNN 등이 있다.
이미지를 분류하는 것보다 이미지 안에 어떤 물체들이 들어 있는지를 구분해내는 것이 훨씬 어려운 작업이다. R-CNN은 이를 위해 몇 단계를 거쳐 미션을 처리한다. 먼저 가능한 이미지 영역을 찾아내는 region proposal 혹은 bounding box를 만드는 단계로 바운딩 박스를 찾기 위해 selective search 알고리즘을 사용합니다. 가령 색상이나 강도 패턴 등이 비슷한 인접한 픽셀을 합치는 방식이다. 그런 다음 추출한 바운딩 박스를(대략 2,000여개) CNN의 입력으로 주입하기 위해 강제로 사이즈를 일원화시킨다. 여기서 사용한 CNN은 미리 훈련된 AlexNet의 변형된 버전이며 CNN의 마지막 단계에서 support vector machine을 사용하여 이미지를 분류한다. 그리고 최종적으로 분류된 오브젝트의 바운딩 박스 좌표를 더 정확히 맞추기 위해 선형 회귀(linear regression) 모델을 사용합니다[1].
R-CNN의 문제점은 모든 바운딩 박스마다 CNN을 돌려야 하고 분류를 위한 SVM, 바운딩 박스를 위한 선형 회귀까지 세가지 모델을 모두 훈련시키기 어렵다는 점이다. Fast R-CNN은 이 문제들을 해결했다. 먼저 바운딩 박스들 사이에 겹치는 영역이 많은데 이들을 따로 따로 CNN을 통과시키는 것은 비용 낭비라고 생각되었다. 여기에서 RoIPoolRegion of Interest Pooling의 개념을 도입하여 셀렉티브 서치에서 찾은 바운딩 박스 정보를 CNN을 통과하면서 유지시키고 최종 CNN 특성 맵으로 부터 해당 영역을 추출하여 pooling 한다. 이렇게 하면 바운딩 박스마다 CNN을 돌리는 시간을 획기적으로 단축할 수 있다.
참고 자료
https://tensorflow.blog/2017/06/05/from-r-cnn-to-mask-r-cnn/
http://blog.naver.com/actachiral/220838739977
http://item.gmarket.co.kr/Item?goodscode=1510118207&pos_shop _cd=SH&pos_class_cd=111111111&pos_class_kind=T&keyword_seqno =17373349894&search_keyword=%ED%8C%8C%EC%9D%B8%EB%B7%B0+GX2000