Today I learned 5주차 Machine Learning 기초 Day2 + a

결정이론이란!

새로운 값 x가 주어졌을 때 확률모델 p(x, t)에 기반해 최적의 결정을 내리는 것

  • 추론단계 : 결합확률 분포 p(x,Ck)p(x, C_k)
  • 결정단계 : 상황에 대한 확률이 주어졌을 때 어떻게 최적의 결정을 내릴 것인지를 결정하는 단계이다

기대손실 최소화(minimizing the expected loss)

모든 결정이 동일한 리스크를 갖고 있는것은 아니다

ex)

  • 암이 아닌데 암인 것으로 진단
  • 암이 맞는데 암이 아닌것으로 진단

E[L] 수식 정리

기대손실 최소화 의료진단 예시

  • 암이 아닌데 암인 것으로 진단 1
  • 암이 맞는데 암이 아닌것으로 진단 100

결정이론 회귀

  • 손실함수 L(x,y(x))=(y(x)t)2L(x, y(x)) = {(y(x) - t)}^2

  • x를 위한 최적의 예측값 y(x)y(x) 의 경우 Et[tx]E_t[t|x]

Euler - Lagrange Equation

  • Euler -Lagrange Equation을 통해 손실함수의 기댓값을
    최소 로 하는 y(x)를 구할수 있다.

  • 이때 dG/dxdydG*/dxdy'

  • 위 식과 같이 y(x)y(x) 의 경우 Et[tx]E_t[t|x]

EDA과제중 코드 꿀팁

'100%' 이런 string형태의 퍼센트를 float형태로 바꿔주자

def ptf(p):
    return float(p.strip('%'))/100 #'35%' -> 0.35
    

info로 데이터 타입 확인하자

null값들 확인하려면

  • dataframe.isnull().sum()

각 열마다 데이터 타입 바꿔 주기

  • data[내가원하는열].astype("내가원하는 타입" ex) bool, float64, int64)

데이터에 null값이 있는데 이를 바꿔 주고 싶다면

  • data['null값이있는열'] = data['null값이있는열].replace(np.nan,"내가 봐꿔 주고 싶은것)

코딩테스트 준비하며 알게된것

print('새로 알게된것', end= " ")
print("end를 쓰면 두줄이 한줄로 나와요")
# 새로 알게된것 end를 쓰면 두줄이 한줄로 나와요

좋은 웹페이지 즐겨찾기