Today I learned 5주차 Machine Learning 기초 Day2 + a
결정이론이란!
새로운 값 x가 주어졌을 때 확률모델 p(x, t)에 기반해 최적의 결정을 내리는 것
- 추론단계 : 결합확률 분포 를 구하는것 - 를 직접 구하는 경우도 있음-
- 결정단계 : 상황에 대한 확률이 주어졌을 때 어떻게 최적의 결정을 내릴 것인지를 결정하는 단계이다
기대손실 최소화(minimizing the expected loss)
모든 결정이 동일한 리스크를 갖고 있는것은 아니다
ex)
- 암이 아닌데 암인 것으로 진단
- 암이 맞는데 암이 아닌것으로 진단
E[L] 수식 정리
모든 결정이 동일한 리스크를 갖고 있는것은 아니다
ex)
- 암이 아닌데 암인 것으로 진단
- 암이 맞는데 암이 아닌것으로 진단
E[L] 수식 정리
기대손실 최소화 의료진단 예시
- 암이 아닌데 암인 것으로 진단 1
- 암이 맞는데 암이 아닌것으로 진단 100
결정이론 회귀
-
손실함수
-
x를 위한 최적의 예측값 의 경우 이다.
Euler - Lagrange Equation
손실함수
x를 위한 최적의 예측값 의 경우 이다.
-
Euler -Lagrange Equation을 통해 손실함수의 기댓값을
최소 로 하는 y(x)를 구할수 있다. -
이때 의 경우 0이 되기에 계산이 쉽게 된다
-
위 식과 같이 의 경우 임을 알 수있었다.
EDA과제중 코드 꿀팁
'100%' 이런 string형태의 퍼센트를 float형태로 바꿔주자
def ptf(p):
return float(p.strip('%'))/100 #'35%' -> 0.35
info로 데이터 타입 확인하자
def ptf(p):
return float(p.strip('%'))/100 #'35%' -> 0.35
null값들 확인하려면
- dataframe.isnull().sum()
각 열마다 데이터 타입 바꿔 주기
- data[내가원하는열].astype("내가원하는 타입" ex) bool, float64, int64)
데이터에 null값이 있는데 이를 바꿔 주고 싶다면
- data['null값이있는열'] = data['null값이있는열].replace(np.nan,"내가 봐꿔 주고 싶은것)
코딩테스트 준비하며 알게된것
print('새로 알게된것', end= " ")
print("end를 쓰면 두줄이 한줄로 나와요")
# 새로 알게된것 end를 쓰면 두줄이 한줄로 나와요
Author And Source
이 문제에 관하여(Today I learned 5주차 Machine Learning 기초 Day2 + a), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@hoon2hooni/Today-I-learned-5주차-Machine-Learning-기초-Day2-a저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)