IT/BigData, 머신러닝
머신러닝의 기초
천진난만한 블로거
2020. 11. 11. 06:10
반응형
지도학습(supervised learning) 은 훈련데이터를 통해 label을 얻는것을 얘기한다
- 분류 - 메일/문자 샘플링
- 예측변수(predictor variable, feature) 을 통한 타켓 값 예측
- 반복직인 훈련(회귀)를 통해 하기 떄문에 많은 데이터가 필요
지도학습에 가장 많이 사용하는 알고리즘 종류
- K-최근접 이웃(k-nearest neighbors)
- 선형회귀
- 로지스틱 회귀
- 서포트 백터
- 결정 트리/랜던 포레스트
- 신경망
비지도 학습이란? unsupervised learning?
지도학습과 달리 훈려네이터에 레이블(분류?)가 없다.
예를 들어 어떤 데이터를 분석하는데 이 데이터를 사용하는 혹은 조회하는 사용자의 정보가 없을때.이러한 경우 머신러닝이 스스로 학습해서 사용자를 분류하는것을 얘기한다.
비지도 학습에 사용하는 알고리즘 종류
- 군집(clustering)
- k-means
- 계층 군집 분석
- 이상치, 특이점 탐지
- 이 알고리즘을 위해서는 순수한 데이터가 필요하다 왜냐하면 이 알고리즘은 정상 데이터가 아닌것을 찾아내는것이기 때문이다. 이상한 값이 들어가 있으면 그것 또한 정상적인 값으로 생각할 수 있기 때문이다
- ex) 신용거래의 이상한 거래 내역감지?
- 시각각화 알고리즘 종류
- 커널
- 원리 분석?(principla component analysis)
- 연관 규칙 학습
- 연관된 것들을 찾아내는 학습 방법이다.
- ex) 술사는 사람은 담배도 같이산다
- ex) 토익책을 사는 사람은 취준생이다
강화 학습이란? reinforcement learning?
이 알고리즘은 enviroment를 모니터링하여 실천하고 긍정적(reward)혹은 부정적(penalty)를 받는 방식이다
보상을 받기 위해 정책을 수립하는 과정이라고 할수있다
강화학습의 예로 알파고가 있다. 결국 바둑게임에서 이기기 위한(reward)를 받기 위한 policy를 계속 찾는 학습이다
반응형