ML study > Object Detection > Background

Dataset 종류

  • 앞선 History에서 살펴보았듯이 object detection에 있어서 dataset은 굉장히 중요한 역할을 하며 현재 소개되고 있는 다양한 모델들 사이의 성능 비교를 위해서도 매우 중요하다.

Source

  • 대표적으로 위 그림과 같이 PASCAL VOC, ImageNet, MS COCO, Open Images 4 종류가 있다.

  • PASCAL VOC는 20개의 카테고리 데이터를 가지고 있으며 모델 평가에 있어 기준이 되었었던 데이터 셋이지만 최근에는 더 큰 데이터셋의 등장으로 인해 조금씩 밀려나는 추세이다.

  • ImageNet1000은 1000개의 class과 1.2 million개의 이미지로 구성되어 있으며 ILSVRC image classification challenge에서 평가 기준으로 주로 사용되고 있다.

  • MS COCO는 ImageNet에서 물체가 주로 가운데 위치하고 큰 경향이 있어 실제 환경과는 거리감이 있다고 판단하여 만들어진 dataset으로 다양한 크기의 물체가 있는 이미지를 제공하며 bounding box 뿐만 아니라 pixel단위의 segmentation output까지 제공하며 현재 object detection 성능 비교의 평가 기준으로 주로 사용되고 있다.

  • Open Images 는 현재 사용가능한 데이터셋 중에서 가장 큰 데이터 셋이다. 이 데이터셋은 앞선 데이터셋과 큰 차이가 있는데 annotation을 구성하는 방식이다. 처음부터 label을 사람이 다는 것이 아니라 classifier가 1차적으로 label을 만들고 그 중 높은 score를 가진 label들을 사람이 판단하여 확인하는 방식으로 제작되었다. object detection 기술이 발전함에 따라 점차 Open Images를 평가 기준으로 사용하는 model이 많아질 것으로 예상된다.

  • 다음은 위 4가지 dataset의 특징을 요약한 표이다.

Source

Reference

[1]: Deep Learning for Generic Object Detection: A Survey



댓글남기기