python 집합 알고리즘 선택 방법 인 스 턴 스
1.데이터 세트 가 높 은 차원 이 라면 스펙트럼 집합 을 선택 하 는 것 은 서브 공간의 일종 이다.
2.만약 에 데이터 양 이 중 소형 이 라면 예 를 들 어 100 W 조 이내 에 K 평균치 가 더 좋 은 선택 이 될 것 이다.데이터 양 이 100 W 개 를 넘 으 면 미니 BatchKMeans 를 사용 하 는 것 도 고려 할 수 있다.
3.만약 에 데이터 에 소음(분리 점)이 집중 되면 밀도 에 기반 한 DBSCAN 을 사용 하면 이 문 제 를 효과적으로 해결 할 수 있다.
4.더 높 은 분류 정확성 을 추구한다 면 스펙트럼 집합 류 를 선택 하 는 것 이 K 평균치 보다 정확성 이 좋다.
실례
import numpy as np
import matplotlib.pyplot as plt
#
raw_data = np.loadtxt('./pythonlearn/cluster.txt') #
X = raw_data[:, :-1] #
y_true = raw_data[:, -1]
print(X)
지식 포인트 확장:분류 알고리즘
많은 유형의 분류 알고리즘 이 있다.많은 알고리즘 들 이 특징 공간 에서 의 예시 사이 에 유사 도 나 거리 도량 을 사용 하여 밀 집 된 관측 구역 을 발견 한다.따라서 집합 알고리즘 을 사용 하기 전에 데 이 터 를 확장 하 는 것 은 좋 은 실천 이다.
집합 분석의 모든 목표 의 핵심 은 군집 한 각 대상 간 의 유사 정도(또는 정도)의 개념 이다.집합 방법 은 대상 에 게 제공 하 는 유사 성 정의 에 따라 대상 을 그룹 으로 나 누 려 고 시도 합 니 다.
일부 집합 알고리즘 은 데이터 에서 발견 할 클 러 스 터 의 수량 을 지정 하거나 추측 하 라 고 요구 하 며,다른 알고리즘 은 관측 간 의 최소 거 리 를 지정 하 라 고 요구 합 니 다.그 중에서 예 시 는'닫 기'또는'연결'으로 볼 수 있 습 니 다.따라서 집합 분석 은 교체 과정 으로 이 과정 에서 식별 되 는 군집 에 대한 주관적 평 가 는 알고리즘 설정 의 변화 에 피드백 되 고 기대 하거나 적당 한 결 과 를 얻 을 때 까지 한다.scikit-learn 라 이브 러 리 는 서로 다른 집합 알고리즘 을 제공 하여 선택 할 수 있 습 니 다.다음은 비교적 유행 하 는 10 가지 알고리즘 을 보 여 줍 니 다.
친화력 전파
중합 체
고 스 혼합
모든 알고리즘 은 데이터 에서 자연 그룹 을 발견 하 는 도전 에 대응 하 는 다양한 방법 을 제공 했다.가장 좋 은 집합 알고리즘 도 없고 가장 좋 은 알고리즘 을 찾 아 데이터 에 제어 실험 을 사용 하지 않 았 습 니 다.본 튜 토리 얼 에서,우 리 는 scikit-learn 라 이브 러 리 에서 온 이 10 개의 유행 하 는 분류 알고리즘 중 하 나 를 어떻게 사용 하 는 지 되 돌아 볼 것 이다.이 예제 들 은 붙 여 넣 기 예제 를 복사 하고 자신의 데이터 에서 테스트 방법 에 기 초 를 제공 할 것 입 니 다.우 리 는 알고리즘 이 어떻게 일 하 는 지 에 대한 이론 을 깊이 연구 하지 도 않 고 직접 비교 하지 도 않 을 것 이다.우리 깊이 연구 합 시다.
python 집합 알고리즘 선택 방법 인 스 턴 스 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 python 집합 알고리즘 이 어떻게 내용 을 선택 하 는 지 에 대해 서 는 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 저 희 를 많이 사랑 해 주세요!
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
로마 숫자를 정수로 또는 그 반대로 변환그 중 하나는 로마 숫자를 정수로 변환하는 함수를 만드는 것이었고 두 번째는 그 반대를 수행하는 함수를 만드는 것이었습니다. 문자만 포함합니다'I', 'V', 'X', 'L', 'C', 'D', 'M' ; 문자열이 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.