딥러닝 개념정리 노트 - 머신 러닝 / Supervised learning / Unsupervised learning
- 설명 없이 간단하게 딥러닝 관련 용어 및 개념을 정리합니다.
Machine Learning (머신러닝) : 컴퓨터가 학습할 수 있도록 하는 알고리즘과 그 기술
사용하는 이유 : 명시적 프로그래밍으로 코드를 짜기엔 너무 어려운 문제들이 많음. 예) 스팸 메일 필터링
머신러닝의 종류
Supervised learning (지도학습) : 이미 답이 정해져 있는 데이터 (Training set)를 바탕으로 컴퓨터를 학습시킴.
사용 예시) 물체 인식 및 구분 (CIFAR 10), 손글씨 식별 (MNIST), 욕설 차단 프로그램
Unsupervised learning (비지도학습) : 답이 정해져 있지 않은 데이터를 바탕으로 컴퓨터를 학습시킴.
사용 예시) 구글 뉴스(https://news.google.com), 단어 군집화 (word clustering) 등
Training data set : 머신러닝 모델을 학습시키는데 필요한 데이터의 집합.
가령, 손글씨 인식 문제에서는 손글씨와 그 손글씨가 뭐라고 적혀있는지에 대한 정답,
단어 군집화 문제에서는 수많은 단어들.
+ Reinforcement Learning (강화 학습) : 데이터 없이 컴퓨터 혼자 학습하는 것.
에이전트 (컴퓨터)가 주변 상황 및 현재의 상황을 스스로 인식하여, 가장 좋은 방법으로 행동을 취하게 함.
예) 알파고, Atari Pong AI (https://www.youtube.com/watch?v=PSQt5KGv7Vk)
Supervised learning 의 종류
1. Regression (회귀)
Regression이란, "통계학에서, 회귀 분석은 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법이다" 위키백과 펌.
쉽게 말하자면, 그냥 원래 있는 데이터들을 바탕으로 다른 데이터들에 대한 정답 구하기.
예) 시험 성적 예측하기
2. Classification (분류)
2-1. Binary Classification (이진 분류)
두 가지 정답으로 이루어진 것들을 분류하는 것.
예) 어떤 사진이 개의 사진인지 / 고양이의 사진인지 구분하는 것
예2) 메일을 봤을 때 이게 스팸메일인지 / 그냥 일반 메일인지 구분하는 것
2-2. Multi-label Classification (Multinomial Classification이라고도 불림, 다중 분류)
세 가지 이상의 정답으로 이루어진 것들을 분류하는 것.
예) 손으로 쓴 숫자를 봤을 때, 이게 0부터 9까지 어떤 숫자인지 알아맞히는 것.(MNIST)
예 2) 이미지를 봤을 때, 이게 사람의 이미지인지 / 동물의 이미지인지 / 식물의 이미지인지 등으로 분류하는 것.
'인공지능 > 딥러닝 개념 정리노트' 카테고리의 다른 글
텐서플로우 - Linear regression 코드 정리 (0) | 2019.04.03 |
---|