청결합니까 아니면 더러운 난방 에어컨입니까?Amazon SageMaker 및 Amazon Rekognition 사용자 지정 태그를 사용하여 자동 감지

ML 분류: 아마존 Rekognion 또는 아마존 SageMaker?


최근 몇 년 동안 사람들은 신경 네트워크를 이용하여 컴퓨터 시각 문제를 해결하여 전대미문의 성과를 거두었고 인류에 가까운 정확도를 끊임없이 높였다.
본고에서 Neosperience 고객과 관련된 심상치 않은 배경에서 이미지 분류에 중심을 두었고 이 고객은 두 가지 다른 방법을 비교할 수 있는 기회를 제공했다. 그것이 바로 아마존 Rekognition 맞춤형 라벨과 아마존 SageMaker 맞춤형 모델이다.
이 두 가지 방법은 모두 장점이 있어 주어진 환경에서 자신의 위치를 찾을 수 있지만 아마존 Rekognion 맞춤형 라벨은 출시 시간과 원가 사이에 흥미로운 균형을 제공한다.

엘리시아


기계 학습 응용은 연구 분야에서 공업 분야로 안정적으로 옮겨가고 있으며 간단한 목표에서 위험 환경에서의 인원 추적까지 광범위한 응용 분야를 개척하고 있다.
이런 상황에서 브랜드는 목표 시장을 혁신하고 현대 기계 학습 응용 프로그램이 실현할 수 있는 기능을 가진 스마트 제품을 출시하기로 결정했다.
최근 20년 동안 알리세아는 난방, 통풍, 에어컨(HVAC) 시스템 소독 시장의 리더로 이탈리아와 외국에서 3000여 개의 고객을 보유하고 있다.2005년에 Alisea는 가장 선진적인 혁신을 통해 시장에 가장 좋은 난방과 에어컨 위생 관리 서비스를 타협하지 않고 제공하는 사명을 짊어졌다.
Alisea의 고객 범위는 회사 사무실에서 백화점, 슈퍼마켓과 호텔까지입니다.최근 몇 년 동안 미국에서 개인 주택도 난방 에어컨 기술을 이용하여 공기 온도를 조절하는데, 왜냐하면 그 효율이 표준 에어컨 시스템보다 높기 때문이다.
모든 난방과 에어컨 설비는 정기적으로 검사를 받아야 하며, 보통 매년 한 번씩 검사를 해서 가장 낮은 위생 수준을 제공하고, 사람에 대한 위험을 줄여야 한다.
불행하게도 붐비는 환경에서 이것은 위험 생물 관리에 충분한 보증을 제공할 수 없다. 세균, 먼지와 바이러스 등 유해 요소의 전환 속도가 종종 예상보다 빠르다.
인간의 환경이 가장 안전하도록 하기 위해서는 호흡기 질환의 전파를 피하기 위해 공기의 질과 식물의 상태를 자주 검사해야 하는데 비싼 절차다.

Remotair 소개


몇 년 전에 알리세아는 시장을 혁신하고 새로운 스마트 제품을 개발하여 실시간으로 파이프 상태를 측정하고 공기의 질과 청결도가 위험 한도값보다 낮을 때 경보를 울리기로 결정했다.
그 시스템에는 압력, 습도, 이산화탄소 센서, 두 개의 카메라가 있는 하드웨어판이 포함되어 있다.정기적으로 풍관 상태의 스냅숏을 촬영하고 기계 학습 모형을 통해 발전소가 사람에게 위험이 있는지 확인해야 한다.이 기능을 시각적 청결이라고 부른다

Amazon SageMaker에서 ResNet으로 구현


시각 청결 기계 학습 모델의 첫 번째 실현은 ResNet50 신경 네트워크로 구성되어 있으며 이 신경 네트워크는 PyTorchFastAI 라이브러리로 훈련을 하고 전이 학습과 손실 함수 조정을 가진다.데이터 준비 단계에서도 상당한 노력이 필요하다.
훈련 단계는 0.90~0.92의 최종 정확도 점수를 얻기 위해 몇 시간과 100단계가 걸린다.

그 결과 Amazon SageMaker를 통해 서비스를 제공하고 HTTP 노드로 호출하는 딥러닝 모델이다.
임무를 처리하고 데이터 집합을 준비하며 네트워크를 구축하고 훈련 단계를 미세하게 조정해야 한다.

아마존 Rekognion 맞춤형 레이블


AWS가 Rekognion 맞춤형 레이블을 발표한 후, 우리는 결과를 우리의 시각적 청결 실현과 Rekognion이 발생한 결과를 비교하기로 결정했다.

사진 업로드


데이터 세트를 만드는 첫 번째 단계는 이미지를 S3에 업로드하거나 Amazon Rekognion에 직접 업로드하는 것입니다.


최근에는 콘솔에 이미지를 업로드하는 기능이 추가되었습니다.그러나 재현성은 산업 프로젝트에서 매우 중요하기 때문에 우리는 데이터를 S3 저장통에 업로드하고 탭마다 폴더를 나누어 더럽고 깨끗함을 예측하기로 결정했다.대량 데이터 업로드는 다음 명령줄을 통해 수행할 수 있습니다.
aws s3 sync <source_path> s3://<destination_bucket>
이미지를 업로드한 후에는 아마존 Rekognition에서 데이터에 액세스할 수 있도록 스토리지 통에 액세스 정책을 설정해야 합니다.이를 통해 Bucket 정책(S3의 Bucket 속성)에 추가할 수 있습니다.

데이터 세트 만들기


그림을 업로드하면 사용 가능한 데이터 형식을 설명하는 목록 파일을 제공하는 데이터 집합을 만들 수 있습니다.
목록은 같은 파일에 추가된 JSON 줄로 구성됩니다. (주의: JSON 파일 자체가 아니라 JSON 세션을 포함하는 순수한 텍스트 파일입니다.)각 선에는 다음과 같은 구조가 있습니다.
{
    "source-ref": "s3://dataset/images/Slot123_clean.png",
    "visual-clean-dataset-cleanliness": 1,
    "visual-clean-dataset-cleanliness-metadata": {
        "confidence": 1,
        "job-name": "labeling-job/visual-clean-dataset",
        "class-name": "clean",
        "human-annotated": "yes",
        "creation-date": "2020-06-26T17:46:39.176",
        "type": "groundtruth/image-classification"
    }
}
작업을 단순화하려면 Amazon SageMaker Ground Truth 또는 미리 정의된 폴더 구조(각 태그에 해당)를 사용하여 이미지에 레이블을 추가할 수 있습니다.
전체 결과는 다음과 같습니다.

모델 교육 및 평가


데이터 세트가 만들어지면'Train Model'(트레이닝 모델) 버튼을 클릭하면 테스트 세트를 가져오는 방법을 묻는 트레이닝 작업을 트리거할 수 있다.가장 간단한 방법은 Rekognion이 80%의 훈련과 20%의 테스트에서 기존의 데이터 집합을 분할하는 것이다.

이후 교육 작업이 시작되면 몇 시간이 걸려야 완성할 수 있다

이 모델이 교육을 받으면 아마존 Rekognion 맞춤형 라벨의 '프로젝트' 부분에 보고되어 평가될 것이다.

리코그니션 맞춤형 라벨 모형의 정확도가 0.92점에 달하는 것을 발견하고 깜짝 놀랐다.전체 훈련 시간은 1.066시간이다. 이것은 Rekognion이 가장 좋은 모델을 찾기 위해 여러 가지 다른 모델과 파라미터를 동시에 시도했음을 나타낸다.
모델을 훈련한 후에는 API를 통해 이미지를 끝점에 전달하기만 하면 됩니다.
aws rekognition detect-custom-labels \
  --project-version-arn "arn:aws:rekognition:eu-west-1:XXXXXXXXXX:project/alisea-visual-clean/version/alisea-visual-clean.2020-10-26T23.00.38/1603749XXXXX0" \
  --image '{"S3Object": {"Bucket": "dataset.alisea","Name": "clean/Slot_620.JPG"}}' \
  --region eu-west-1
Amazon Rekognion 맞춤형 레이블은 이 모델에 시간당 가격을 제공하기 때문에 추정 없이 언제든지 레이블을 중지하고 시작하여 원가를 낮추거나 데이터 처리를 효율적으로 할 수 있습니다.

결론


Amazon Rekognion은 맞춤형 분류 모델(이진 및 다중 클래스)이 필요할 때마다 머신러닝 모델 개발에 실행 가능한 솔루션을 제공합니다.그것은 전문적인 데이터 과학자가 필요하지 않아서 같은 결과를 제공할 수 있다.가격 모델은 시간당 1회, 고정 비용은 시간당 1달러, 시간당 4달러입니다.모델의 작업 시간을 최적화함으로써 작업 창을 줄이고 더욱 좋은 설정 원가를 실현할 수 있다.

좋은 웹페이지 즐겨찾기