ML study > Object Detection > Two stage detection
Light Head R-CNN
- Light Head R-CNN 은 그동안의 two stage object detection model의 속도가 one stage object detection model보다 느린 가장 큰 이유를 무거운 head 구조로 말하며 새로운 head 구조를 제시함으로써 놀라운 속도 향상을 얻었다.
1. Light Head R-CNN 동작
-
Faster R-CNN에서 FC 이루어진 무거운 head 부분은 RFCN에서 score map이라는 개념을 도입하여 conv 네트워크 연산이 가능하게끔 만들었었다.
-
RFCN 구조로 상대적으로 Head 구조가 가벼워졌지만 class가 많아지고 풀링 사이즈가 커질수록 score map역시 늘어나는 문제가 있었다.
-
본 논문에서는 Xception이라는 가벼운 backbone network와 Large separable convolution을 통한 얇은 feature map, 가벼운 FC layer를 사용하여 위 문제들을 개선하였다.
2. Light Head R-CNN 결과
- Two stage 기반으로 102 fps 라는 놀라운 결과를 기록하였으며 mAP에서도 R-FCN보다 좋은 결과를 기록하였다.
Reference
[1]: Deep Learning for Generic Object Detection: A Survey
[2]: Light Head R-CNN 논문
댓글남기기