4.4 AI 기초

배운것

머신러닝

머신러닝의 시작은 1950년대부터 시작했음
수학을 이용해서 데이터를 처리하다가
한계점을 느끼고 사람의 뇌를 연구하면서 딥러닝으로 발전하게됨
인간에서 컴퓨터 자원을 주로 쓰게 되면서 GPU가 중요하게 됬다.
텍스트를 분석하는게 NLP


컴퓨터 사이언스는
	사람이 찾아서 기계한테 알려줌
		vs Machine Learning
 			데이터를 많이 주고 컴퓨터가 찾게 함

모델을 웹서버에 올려놓고 사용해서 문제를 바로 해결한다.

supervised learning 지도 학습

	문제와 정답 제공
    Regression,Classification, 
    - classification 분류 : 10000장의 고양이사진과 10000장의 개사진을 학습시키고
    						feator과rabel를 가지고 새로운사진을 분류하는것
    - Regression 회귀 : 일반적인 사람들의 데이터를 수집해서 
    				x축이 신발사이즈, y가 키
                    평균이 될만한사람들의 데이터를 점으로 찍고 
                    이를 지나는 선을 회귀곡선이라고 하고 
                    새로운 사람이 왔을때 예측 할수있게 함

비지도학습

문제만 제공 
Anomaly, Clustering
- Anomaly 이상징후 감지 : 카드사에서 많이 사용
						임계치를 넘어가면 거래를 중단시키고 거래를 확인하는 것
                        급작스러운 조회수를 감지해서 가짜 뉴스를 잡아낼 수 있음

- Clustering 군집화 : Raw data을 Algorithm을 사용해서 Automated clusters로 바꾸는것
		첫번째 방법 : 선을 그어서 가장 환벽하게 나누어지는 라인을 찾는것
        두번째 방법 : 각 지점의 대표데이터를 뽑고, 대표를 주변으로 뭉쳐보는것 
        등등
        

강화학습 Reinforcement Learning

보상 제공 인과관계가 중요 게임(알파고),로봇
- 어쩌다가 한번 성공했을때 이에 대한 보상을 제공함으로서 학습하는것
- 로봇들의 행동에 대해 점수를 매겨서 높은 점수를 주는 행동을 하게 하는 것

깃허브: 커밋?푸쉬?

kaggle.com, orange data mining.com

https://www.kaggle.com/
https://orangedatamining.com/

Text and score
MSE : Mean Squared Error. 제곱을 함으로서 오차를 크게 보이게 한다,
RMSE : Root Mean Squared Error. 루트를 함으로 위의 방법보다 안정성을 높여줌
MAE : mean absolute error 절대 오차 평균
R2 : 1이면 오차가 없는것,

tree 알고리즘 : 계속 yes no로 가면서 결과를 만들어 내는것, 여러 트리를 만들어서
forest: 여러 트리를 만들어서 집합
jungle: forest들을 모아서 만들기

충분한데이터가 있어야 그 데이터의 특성을 반영할 수 있다.

빅데이터 센터

https://kbig.kr/portal/kbig/datacube/onl_edu_class.page

어려웠던 점 및 해결방법

너무 이론적인 것들이라, 이걸 외워야될지, 넘겨야될지 고민됐다. 그래서 복습하면서 필요한 부분만 골라서 외우기로 함.

학습소감

점심을 안 거르고 해서 끝까지 집중할수있어서 다행인것 같다.

좋은 웹페이지 즐겨찾기