CVAT에서 시뮬레이션 속도 - 이미지 분류 편

개요


기계 학습 프로젝트에서 어떻게 효율적으로 학습 데이터를 대량으로 수집하는가가 매우 큰 과제이다.학습 데이터의 크기에 따라 사용할 수 있는 방법도 다르고 모델의 정밀도에도 큰 영향을 미친다.사이트 등에서 자동으로 수집할 수 있는 경우를 제외하고는 대부분의 경우 인간은 수동으로 가상 조작을 해야 하지만 수집된 기계 학습량은 시간과 비용이 필요하다.대량의 데이터를 만들기 위해서는 효율적으로 개편하는 환경이 중요하다.
이 글에서 우리는 CVAT라는 모조 도구를 사용하여 이미지 분류의 학습 데이터를 신속하게 만드는 방법을 소개했다.
https://github.com/openvinotoolkit/cvat

데모


실제로 개편을 한 것 같습니다.화면 왼쪽 아래에 키보드가 입력한 키가 표시됩니다.12만 입력했지만 반대로 이렇게 하면 개편이 가능한 환경을 구축할 수 있다.

메서드


다음은 CVAT에서 실제로 개편하는 방법에 대한 설명입니다.이번에는 Pytruch의 강좌에서 소개한 벌과 개미를 분류하는 임무를 예로 들어 그들에게 소개를 해 보자(실제 데이터는 이미 개편되었다).
https://pytorch.org/tutorials/beginner/transfer_learning_tutorial.html

CVAT 시작


CVAT는 인터넷 응용 프로그램으로 제공되며 Docker를 사용하여 로컬에서도 쉽게 시작할 수 있습니다.자세한 내용은 installation.md를 참조하십시오.CVAT 개발이 활발하다develop 지점이 불안정한 부분이 있어 이곳에서 사용v1.2.0.
$ git clone https://github.com/opencv/cvat
$ cd cvat 
$ git checkout refs/tags/v1.2.0
$ docker-compose up

새 프로젝트 및 Task


CVAT를 시작하면 먼저 오른쪽 상단의 Create a new project 버튼에서 새 프로젝트를 만듭니다.CVAT는 Project→Task와 같은 계층 구조로 한 항목에 여러 개의 작업을 포함한다.프로젝트 이름과 레이블을 Project에서 설정할 수 있습니다.이번에는 벌과 개미 두 등급으로 라벨antbee 두 개다.탭을 추가할 수 있다면 좋겠습니다.attribute는 비어 있습니다.
다음은 Create a new task로 개별 Task 를 만듭니다.여기에 프레젠테이션 이미지를 업로드합니다.브라우저에 끌어다 놓을 수도 있고,docker-compose를 설정할 때 로컬 특정 디렉터리를 마운트한 다음 읽을 수도 있습니다.

개편을 진행하다


그럼 우리 다시 연습합시다.Task에서 Job을 선택하여 초대 화면을 엽니다.여기 중요한 포인트가 두 가지가 있어요.
  • 오른쪽 위의StandardTag annotation로 변경
  • 이렇게 하면 추가 태그의 단축키
  • 를 사용할 수 있습니다.

  • 체크Automatically go to the next frame
  • 태그를 추가하면 자동으로 다음 이미지로 변환됩니다
  • .
    나머지는 편성만 남았다.오른쪽 아래Shortcut for labels에서 보듯이 각 탭에 숫자에 대응하는 단축키가 분배되어 있다.이번 경우Key1: ant,Key2: bee이기 때문에12버튼을 누르면 라벨을 줄 수 있다.

    결과 내보내기


    마지막으로 개편된 결과를 봅시다.왼쪽 위의 햄버거 메뉴Dump Annotation에서 다양한 형식으로 결과를 출력할 수 있습니다.CVAT for Images 1.1 형식으로 출력하면 XML 파일이 zip 압축으로 저장됩니다.XML 파일에는 다음과 같이 CVAT에 설정된 다양한 메타 정보와 시뮬레이션 결과가 포함되어 있습니다.그리고 여기에 파일 이름과 라벨을 추출하는 코드를 쓰면 완성됩니다.
      <image id="3" name="antbee/20935278_9190345f6b.jpg" width="500" height="375">
        <tag label="ant" source="manual">
        </tag>
      </image>
      <image id="2" name="antbee/17209602_fe5a5a746f.jpg" width="500" height="412">
        <tag label="bee" source="manual">
        </tag>
      </image>
      <image id="1" name="antbee/16838648_415acd9e3f.jpg" width="500" height="450">
        <tag label="bee" source="manual">
        </tag>
      </image>
      <image id="0" name="antbee/0013035.jpg" width="768" height="512">
        <tag label="ant" source="manual">
        </tag>
      </image>
    

    총결산


    이번에는 CVAT를 이용하여 고속으로 이미지를 분류하는 시뮬레이션 방법을 설명했다.CVAT는 또한 이미지의 분할과 물체 탐지 등 시뮬레이션을 지원하며 각종 단축키와 여러 사람의 시뮬레이션 기능을 제공한다.이 기사에는 설명이 끝나지 않는 기능도 많기 때문에 CVAT를 꼭 실제로 접해 개편해 주시기 바랍니다.

    참고 자료

  • openvinotoolkit/cvat: Powerful and efficient Computer Vision Annotation Tool (CVAT)
  • CVAT User Guide
  • 좋은 웹페이지 즐겨찾기