python 집합 알고리즘 선택 방법 인 스 턴 스

설명 하 다.
1.데이터 세트 가 높 은 차원 이 라면 스펙트럼 집합 을 선택 하 는 것 은 서브 공간의 일종 이다.
2.만약 에 데이터 양 이 중 소형 이 라면 예 를 들 어 100 W 조 이내 에 K 평균치 가 더 좋 은 선택 이 될 것 이다.데이터 양 이 100 W 개 를 넘 으 면 미니 BatchKMeans 를 사용 하 는 것 도 고려 할 수 있다.
3.만약 에 데이터 에 소음(분리 점)이 집중 되면 밀도 에 기반 한 DBSCAN 을 사용 하면 이 문 제 를 효과적으로 해결 할 수 있다.
4.더 높 은 분류 정확성 을 추구한다 면 스펙트럼 집합 류 를 선택 하 는 것 이 K 평균치 보다 정확성 이 좋다.
실례

import numpy as np
import matplotlib.pyplot as plt
 
 
#     
raw_data = np.loadtxt('./pythonlearn/cluster.txt') #       
X = raw_data[:, :-1] #         
y_true = raw_data[:, -1]
 
print(X)
지식 포인트 확장:
분류 알고리즘
많은 유형의 분류 알고리즘 이 있다.많은 알고리즘 들 이 특징 공간 에서 의 예시 사이 에 유사 도 나 거리 도량 을 사용 하여 밀 집 된 관측 구역 을 발견 한다.따라서 집합 알고리즘 을 사용 하기 전에 데 이 터 를 확장 하 는 것 은 좋 은 실천 이다.
집합 분석의 모든 목표 의 핵심 은 군집 한 각 대상 간 의 유사 정도(또는 정도)의 개념 이다.집합 방법 은 대상 에 게 제공 하 는 유사 성 정의 에 따라 대상 을 그룹 으로 나 누 려 고 시도 합 니 다.
일부 집합 알고리즘 은 데이터 에서 발견 할 클 러 스 터 의 수량 을 지정 하거나 추측 하 라 고 요구 하 며,다른 알고리즘 은 관측 간 의 최소 거 리 를 지정 하 라 고 요구 합 니 다.그 중에서 예 시 는'닫 기'또는'연결'으로 볼 수 있 습 니 다.따라서 집합 분석 은 교체 과정 으로 이 과정 에서 식별 되 는 군집 에 대한 주관적 평 가 는 알고리즘 설정 의 변화 에 피드백 되 고 기대 하거나 적당 한 결 과 를 얻 을 때 까지 한다.scikit-learn 라 이브 러 리 는 서로 다른 집합 알고리즘 을 제공 하여 선택 할 수 있 습 니 다.다음은 비교적 유행 하 는 10 가지 알고리즘 을 보 여 줍 니 다.
친화력 전파
중합 체
  • BIRCH
  • DBSCAN
  • K-평균치Mini-Patch K-평균치
  • Mean Shift
  • OPTICS
  • 스펙트럼 집합
    고 스 혼합
    모든 알고리즘 은 데이터 에서 자연 그룹 을 발견 하 는 도전 에 대응 하 는 다양한 방법 을 제공 했다.가장 좋 은 집합 알고리즘 도 없고 가장 좋 은 알고리즘 을 찾 아 데이터 에 제어 실험 을 사용 하지 않 았 습 니 다.본 튜 토리 얼 에서,우 리 는 scikit-learn 라 이브 러 리 에서 온 이 10 개의 유행 하 는 분류 알고리즘 중 하 나 를 어떻게 사용 하 는 지 되 돌아 볼 것 이다.이 예제 들 은 붙 여 넣 기 예제 를 복사 하고 자신의 데이터 에서 테스트 방법 에 기 초 를 제공 할 것 입 니 다.우 리 는 알고리즘 이 어떻게 일 하 는 지 에 대한 이론 을 깊이 연구 하지 도 않 고 직접 비교 하지 도 않 을 것 이다.우리 깊이 연구 합 시다.
    python 집합 알고리즘 선택 방법 인 스 턴 스 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 python 집합 알고리즘 이 어떻게 내용 을 선택 하 는 지 에 대해 서 는 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 저 희 를 많이 사랑 해 주세요!

    좋은 웹페이지 즐겨찾기