Azure ML을 통해 연관 행렬 생성하기

5787 단어 통계적Azure
'애저 머신 레어닝이 관련 행렬을 만들 수 있느냐'는 질문에 한번 해봤어요.
TL;DR
  • Azure Machine Learning Studio에서 관련 행렬을 계산할 수 있습니다.
  • 는 Statistical FunctionCompute Linear Correlation에서 사용하면 된다.
  • 샘플 참고Cortana Intelligence Gallery: 연관 행렬 샘플.
  • 용어 설명
    관련 행렬
    대략적으로 말하면 서로 다른 데이터 간의 관계성이 강하다는 것을 나타낸다.
    올바른 정의는 방차 협동 방차 매트릭스와 관련 매트릭스 에 있습니다.
    Azure ML (Azure Machine Learning)
    마이크로소프트가 제공하는 기계 학습 플랫폼.
    여러가지 일을 할 수 있을 것 같지만 상세하지는 않아요.
    Azure Machine Learning
    절차.
    I. 사용할 데이터 세트 선택
    Azure Machine Learning Studio에 Automobile price data(Raw)를 사용하기 쉬운 데이터로 제공하기 때문에 사용합니다.
    참조: Machine learning tutorial: Create your first data science experiment in Azure Machine Learning Studio
    II. 프리 프로세싱
    부족한 값 처리
    Automobile price data(Raw) 패키지에는 손실 값이 포함되어 있으므로 생략합니다.이번에는 주로 손실치를 어떻게 보완하느냐를 보지 않기 때문에 손실치가 많은 데이터와 손실치를 포함하는 데이터를 단순히 삭제했다.
    단계는 Machine learning tutorial: Create your first data science experiment in Azure Machine Learning Studio의 2단계와 거의 같습니다.
    1. normalized-losses 열 삭제
    Select Colums in Dataset 사용

    연결해서...

    비정규 열 데이터 꺼내기

    2. 값이 없는 행을 삭제합니다.
    num-of-doors,bore,strike,horsepower,peak-rpm,price는 손실치를 포함한다.결손 값을 포함하는 줄을 삭제합니다.
    Clean Missing Data를 사용하여 수행합니다.

    3. 수치 데이터 추출
    이번에는 문자열을 숫자로 바꾸지 않고 수치 데이터만 추출합니다.
    Select Colums in Dataset 을 사용합니다.

    다음과 같이 설정합니다.
    スクリーンショット 2016-11-10 22.54.30.png
    이렇게 하면 문자열로 구성된 줄을 필터할 수 있다.

    II. 계산 관련 행렬
    Statistical Function부터 사용Compute Linear Correlation.설정이 없어서 연결만 했어요.

    순조롭게 수출되었다.

    III.CSV를 통한 다운로드
    자꾸'엑셀로 처리하고 싶다'는 소리가 들릴 것 같아 CSV로 출력했다.
    Data Formt ConversionsConvert to CSV를 사용합니다.이것도 그냥 연결이야.

    마지막 ◯ 을 마우스 오른쪽 버튼으로 클릭하면 Download 가 나타납니다.

    이것을 누르면 CSV 파일을 다운로드할 수 있습니다.
    Reference
    Cortana Intelligence Gallery: 연관 행렬 샘플

    좋은 웹페이지 즐겨찾기