sklearn - 훌륭한 개발자 블로그

쓰쿠바 대학의 기계 학습 강좌 : 과제의 파이썬 스크립트 부분을 만들면서 sklearn 공부 (17)

지난번 Youtube에서의 해설:제9회(1) 30분당 과제 8.3은 Cluster3를 잘 재현할 수 없었기 때문에 포기했다. 언제나 아야메 데이터를 주성분 분석하는 문제. 프로그램으로서는 scikit-learn은 간단. 그래프의 부분만 pandas의 scatter_matrix를 사용하는 것이 지금까지와 조금 다를 뿐. Homework_8.7.py 기여율 그래프 제1 주성분의 기여율이 0.92...

파이썬sklearnPCA주성분 분석scikit-learn

쓰쿠바 대학의 기계 학습 강좌 : 과제의 파이썬 스크립트 부분을 만들면서 sklearn 공부 (10)

지난번 이번에는 이상치가 있는 경우 Youtube의 해설은 제6회(1)55분 30초당 프로그램은 2행 더 강좌에서는 최초의 값을 바꾸고 있는 것 같지만, 하나 추가해도 거기까지 변화는 없을 것 같다. 이것은 실행 결과입니다. 크게 벗어난 값이 하나 포튼이라고 해도, 정답이면 힌지 손실에서는 0이 되므로 아무런 영향은 없다. 이것도 똑같이 2행 더하는데, 왠지 좌표가 [5,-35]로 바뀌고 있...

sklearn파이썬scikit-learn힌지 손실

쓰쿠바 대학의 기계 학습 강좌 : 과제의 파이썬 스크립트 부분을 만들면서 sklearn 공부 (9)

지난번 2개의 덩어리를 분류하지만, 덩어리에서 크게 벗어난 이상치가 있는 경우와 없는 경우에 문제가 나뉘어져 있다. Youtube의 해설은 제6회(1)의 54분당 이상치가없는 힌지 손실은 사실 scikit-learn의 example 그대로이다. SVM 부분보다 matplotlib을 사용하는 것이 더 어려웠습니다. 전 자료는 이것 자신의 학습을 위해 코멘트를 추가했다. Homework_5.3_...

sklearn파이썬scikit-learn힌지 손실

쓰쿠바 대학의 기계 학습 강좌 : 과제의 파이썬 스크립트 부분을 만들면서 sklearn 공부 (6)

지난번 Youtube에서의 해설:제5회(1) 15분 50초당 과제 4.1과 거의 같지만, 이번에는 정규화 파라미터를 보다 크게 흔들어($10^{-3} ~ 10^{6}$), 각 계수에의 영향을 봐 가는 문제가 되고 있다. 리지와 라소의 차이가 분명히 알기 때문에 좋은 과제라고 생각한다. 소스 코드는 이것. Homework_4.2.py 덧붙여서 while alpha <= 10 ** 6 + 1: ...

파이썬sklearn리지 회귀라소 회귀scikit-learn

쓰쿠바 대학의 기계 학습 강좌 : 과제의 파이썬 스크립트 부분을 만들면서 sklearn 공부 (3)

Youtube의 해설은 제4회(1) 40분당 $y =\cos(1.5\pi x)$에 $N(0,1)\times0.1$의 오차를 실은 30개의 훈련 데이터를 만들어 다항식 회귀를 한다. 여기에서 교차 검증이 들어간다. 1차부터 20차까지 순서대로 회귀해 간다. 훈련 데이터는 이것. 소스 코드 Homework_3.2.py 전회의 과제 3.1에서는 PolynomialFeatures에서 $x,x^2,x...

sklearn파이썬scikit-learn교차 검증

쓰쿠바 대학의 기계 학습 강좌 : 과제의 Python 스크립트 부분을 만들면서 sklearn 공부 (2)

지난 번부터 계속 이것은 $y =\sin(x)$ 에 $N(0,1)\times0.1$ 의 오차를 실은 훈련 데이터를 만들어, 그것을 다항식으로 회귀시키는 문제. 해설은 제3회(1) 56분 40초당 Homework_3.1.py 회귀의 계산을 시키기 위한 데이터( x_tr )와 그래프 묘화용( x_plot )로 2개 준비하고 있다. 단순히 x_tr = x_plot 그렇게하면 실제 데이터가 복사되지...

sklearn파이썬scikit-learn

scikit-learn의 MultiLabelBinarizer에서 개별 구매 데이터를 표에 요약

각 행은 사용자 ID, 각 열은 사용자가 구입 한 항목을 나타냅니다. 열수는 가장 구매 아이템이 많은 사용자의 구입 수가된다. 따라서 공란에는 NaN이 들어 있다. 각 열을 특정 항목에 고정하여 각 사용자가 구매했는지 1/0으로 표시 scikit-learn의 MultiLabelBinarizer를 사용한다. 변환 전의 데이터 프레임을 df로한다. 변환 후의 출력은 df_trans로한다. 데이터...

sklearnpandas파이썬scikit-learn

【1일 1사경】Build a Stock Prediction Program【Daily_Coding_002】

이 기사는 파이썬, 기계 학습 등을 독학하고 있는 소생의 비망록적인 기사가 됩니다. 분석은 youtube 동영상에서 볼 수 있듯이 Google Colaboratry를 사용했습니다. Step1: 라이브러리 가져오기 이번에는 quandl 라는 라이브러리를 사용합니다. quandl는 주가와 데이터를 가져 오는 라이브러리 인 것 같습니다 (몰랐습니다 ...). 그런 다음 이번에 사용할 라이브러리를 ...

파이썬quandlsklearnYouTube기계 학습

기계 학습 -그라디언트 부스팅 알고리즘/앙상블 학습

이 게시물은 예제와 함께 기계 학습 알고리즘을 다룹니다. Boosting("to Boost", 영어로 증가 또는 개선을 돕거나 장려하는 의미)은 기계 학습에서 기계 모델의 예측 정확도 및 성능을 개선하는 데 사용되는 방법입니다. CATBoost - 다른 기능 중에서 기존 알고리즘과 비교하여 순열 구동 대안을 사용하여 범주형 기능을 해결하려고 시도하는 그래디언트 부스팅 프레임워크를 제공합니다....

adaboostsklearncatboostpython

로컬 및 AWS S3에서 Tensorflow 및 sklearn 파이프라인 저장/로드

이 작업을 수행하는 데 많은 어려움을 겪은 후 마침내 간단한 방법을 찾았습니다. Tensorflow를 사용하여 sklearn 및 joblib 모델/파이프라인을 쓰고 읽을 수 있습니다. boto3 클라이언트를 사용하여 AWS S3에서 동일한 작업을 수행할 수 있습니다....

awssklearntensorflowmachinelearning

말레니아 데이터셋을 활용한 분석, 예측

Waterflow_Death : 말레니아의 궁극기에 죽었는 지 다른 플레이어를 소환할 때보다 하지 않았을 때 더 오래 살아남은 것을 볼 수 있습니다 마법과 상태이상을 쓰는 호스트는 더 오래 살지만 하이브리드나 쌩 근접 무기를 사용하는 호스트는 적은 시간 살아있는 걸 볼 수 있습니다 머 이건 당연한것이지만 페이즈를 더 진행할 수록 더 오래 살아 남는 걸 볼 수 있습니다 이 상황을 바탕으로 분석...

sklearnpython엘든링python

기계학습 초보자에 대한 추천 교재(애니메이션편)

여기서 주의해야 할 것은 이 두 과정이 우리에게 가르치는 기계 학습 모델은'선형 회귀'라고 불리는 것이 가장 기초적이고 감각적으로 이해하기 쉽지만 그것만으로는 아직 멀었다.다른 모델도 많기 때문에 기계학습의 전처리와 모델 등을 배우고 싶은 사람에게는 그다지 추천하지 않는다. 바로'실제 기계 학습에 대한 설명이 많지 않다'는 것이다.즉, 데이터를 보고 분석하고 가시화하며 관련을 보고 만지작거리...

udemyPython기계 학습sklearncoursera

Python을 사용하여 Lasso 구현

Lasso의 실현 Lasso는 선형 모델의 회귀 중의 하나이다. 통상의 최소 2승법과 같은 점 통상의 최소 2승법과 다른 점 척추 회귀와 유사하며 구속 계수($w$)는 0 척추 회귀와 다른 점 정규화 사용 L1 정규화 L1 정규화를 사용하면 완전히 0인 계수가 존재합니다. 사용하지 않는 특징량을 결정하고 모델이 쉽게 해석된다 다음 그림에서 정규화를 통해 왼쪽으로 이동합니다. training ...

sklearn기계 학습Python

파이썬으로 척추 컴백.

척추 회귀는 척추 회귀 실현 척추 회귀는 선형 모델의 회귀 중의 하나다. 통상의 최소 2승법과 같은 점 통상의 최소 2승법과 다른 점 계수($w$)는 훈점 데이터에 대한 예측뿐만 아니라 다른 제약에도 최적화 각 특징량의 영향도를 줄이기 위해 정규화 정규화 다음 그림에서 정규화를 통해 왼쪽으로 이동합니다. 척추 회귀 중 L2 정규화를 사용합니다. 참고로 같은 데이터 집선형 회귀(일반적으로 최소...

sklearn기계 학습Python

Python에서 선형 회귀 구현

python에서 선형 회귀를 실현하고'정밀도'와'모델 복잡성'을 주목한다. 선형 모형 선형 모델을 바탕으로 회귀한다 선형 회귀(일반적으로 최소 2승법) 1차원 데이터에 대한 선형 회귀 고차원 데이터에 대한 선형 회귀 선형 모델은 입력 특징량의 선형 함수를 사용하여 예측한다. 회귀 문제에 사용되는 선형 모델의 예측식은 다음과 같다. 여기에서 $x(0)부터 x(p)$까지 견본의 특징량을 표시합니...

sklearn기계 학습Python

"Xgboost가 무엇입니까"& 주요 매개 변수의 주석

그때 매개 변수를 많이 다루었는데, 다음에 Xgboost를 사용할 때 어떤 매개 변수인지 잊어버린 것 같아서 먼저 정리를 하겠습니다. 반면 Xgboost는 약한 학습기를 구축할 때 이전에 구축된 약한 학습기를 사용한 결과 약한 학습기를 구축했다. 이전에 구축된 학습기로 정확하게 분류된 데이터에 대한 권한 감소 정확하게 분류되지 않은 데이터에 대한 가중치를 높이는 학습기를 만들다. 이렇게 하면...

sklearn기계 학습Pythonxgboost

트랜스퍼 블로그 드문드문 행렬 정의

CSC CSR의 indptr는 하나의 구간을 표시하고 왼쪽으로 열고 오른쪽으로 닫으며 mXn의 모양에 따라 구분한다. 구체적으로 m인지 n인지 CSR(m줄)인지 CSC(n열)인지 보아야 한다. 희소 행렬 정의 （1）Coordinate (COO) 이것은 가장 간단한 형식으로 모든 요소는 하나의 삼원조로 표시해야 한다. 각각 (행호, 열호, 수치)이고 위의 그림 오른쪽에 있는 열에 대응한다.이런...

sklearn

sklearn 교차 검증crossval_score 매개 변수 분석

estimator: 선택한 학습기의 실례 대상, "fit"방법 포함;X:특징수 그룹 y: 탭수 그룹 그룹s: 데이터를 그룹으로 나누어 샘플링해야 할 경우scoring: 평가 함수 cv: 교차 검증된 k값, 정수 또는 None으로 입력하면 추정기는 분류기, y는 2분류 또는 다분류,StratifiedKFold로 데이터 구분fitparams: 사전, 추정기에서fit 방법의 매개 변수를 사전을 통...

sklearn

컬렉션(KMeans)을 통해 init에 ndaray를 사용하여 초기 값을 지정하는 방법

KMeans의 init에'k-means++'나'random'을 지정하는 것이 아니라 ndaray를 지정할 때 좀 곤란해서 적어놨어요. 'k-means++'와'random'을 지정하는 글은 많지만, ndaray를 지정하는 방법은 드물다. 같은 일을 하고 싶은 사람을 도울 수 있다면. 먼저 결과를 말하면 단순히 Daray로 지목하면 좋은데 numby에 익숙하지 않아서 곤란해요. 마음에 드는 점이...

numpysklearnkmeanstech

sklearn - GridSearchCV의 하이퍼패라메트릭 최적화

슈퍼 파라미터: 추정기에서 직접 배우지 않는 파라미터입니다.scikit-learn 패키지에서 추정기 클래스에서 함수를 구성하는 매개 변수로 전달됩니다. 하이퍼파라미터 최적화: 가장 좋은 교차 검증 점수를 얻기 위해 하이퍼파라미터 공간을 검색합니다 매개 변수 격자 위의 교차 검증 격자 검색을 통해 추산기의 지정한 매개 변수 값을 상세하게 검색합니다. 공통 매개변수 목록 매개변수 이름 매개변수 ...

sklearn

sklearn.linear_모델의 선형 회귀 분석에 몇몇 곡선을 적용할 때 계수의 변화를 결정한다

공식. 확정 계수 y=1.0x -0.0 y1 y=1.07x -228.57 y2 y=1.07x +28.57 y3 y=1.0x -7.14 y4 y=0.64x +642.86 y5 y=1.29x -514.29 y6 y=0.64x +542.86 y7 y=1.03x -106.43...

sklearn회귀 분석Python

세계 인구 예측

이번에는 SVM을 이용해 세계 인구를 예측하려고 한다. 앞서 나는 한 편의 문장 을 썼는데 이것은 한 번의 함수가 SVM에 적용되는 것이 의미가 없다고 생각하기 때문에 좋은 제재를 찾았다. 세계 인구가 최근 몇 년 동안 급격히 증가하여 일반적으로 한 번의 함수는 적용되지 않는다고 여긴다. 이쪽 pdf에 세계 인구의 추이가 기록되어 있기 때문에 이걸 사용합니다. 이번에 낡은 데이터를 포함하면 ...

sklearnPython3svmPython

[pythhon] yeo-johnson 변환 후 실진도와 예도의 감소량을 관찰하는 방법

sklearn 을 사용하여 yeo-johnson을 전환하는 방법.yeo-johnson의 변환을 통해 분포는 정적 분포에 가깝다.yeo-johnson을 사용하여 변환할 때의 참고로 하세요. yeo-johnson 변환을 통해 실진도와 첨단의 절대치의 감소량을 나타낸다.실진도와 첨단도는 모두 정규분포에서 0이기 때문에 yeo-johnson을 통해 정규분포에 가까운 지표를 바꾸었다. yeo-john...

sklearnPython