1. 딥러닝과 파이토치
1.1 인공지능과 머신러닝
- 인공지능 : 인간의 사고를 인공적으로 모방한 모든 것
- 머신러닝 : 주어진 데이터를 가지고 통계학적인 모델을 학습시켜 인공지능을 구현하는 방법
- 딥러닝 : 머신러닝의 수많은 방법 중 한 갈래
초기 인공지능 : feature 알려주기 -> 정답 찾아라
머신러닝 : 정답 알려주기 -> feature 찾아라
필요한 거 = 학습시킬 수 있는 데이터 + 찾도록 생각할 수 있는 두뇌
1.2 지도학습, 비지도학습, 강화학습
데이터 특징, 학습 방식에 따라 머신러닝을 지도학습, 비지도학습, 강화학습으로 나눈다.
- 지도학습 : 다음 값 예측하기
- 비지도학습 : 데이터 분포 식별하기
- 강화학습 : 보상-처벌 체계를 통해 배우기
- 1. 지도학습
-
데이터셋으로 입력과 레이블 반복해서 보여주고, 입력과 출력의 연관성을 찾는다. 학습이 끝나면 새로운 데이터를 받아 결과를 예측함.
ex) Src IP, Dst IP 등 받아서 외부IP가 악성인지 아닌지 판단하기
- 장점 : 가장 학습하기 수월 -> 가장 많이 쓰임. (이미지/음성 인식, 기계번역 등)
- 단점 : 사람이 정답 데이터를 다 준비해야 함.
- 2. 비지도학습
- 정답이 없는 정답이 없는 데이터로부터 군집 분석, 데이터 표현, 차원 감소 등을 배울 수 있다
ex) 지도학습 보조용으로 많이 쓰임.
- 장점 : 사람 개입↓
- 단점 : 결과 도출이 어렵다.
- 3. 강화학습
- 보상과 처벌 체계를 세우고 모델이 환경을 경험하면서 배운다. -> 동적임.
주어진 환경에서 상호작용하며 학습. 강아지 훈련과 유사. 말을 잘 들었을 때, 간식 같은 보상을 주고 앉는다 = 간식
이렇게 연결될 때까지 반복.
풀고자 하는 문제에서의 보상 방식을 잘 설계하는 것이 핵심.
📌 찾아보기
- 군집 분석(=clustering) : 데이터의 유사도를 측정하여 유사도 높은 집단끼리 분류 및 특징 파악하는 것.
- 차원 감소 : 대표적인 예시가 주성분 분석.
📌 찾아보기
강화학습과 지도학습의 명확한 차이를 모르겠다. 지도학습을 끊어서 여러 번 반복하면 강화학습이라 할 수 있는 건가?
- 💡 참고 링크
- 강화 학습은 사람으로부터 학습을 받는 것이 아니라 변화되는 환경으로부터 보상을 받아 학습한다는 점에서 차이를 보인다.
이 외에도 여러 가지 있음.
- 준지도학습 : 레이블이 부족한 데이터를 학습함.
- 메타학습 : 학습법 자체를 연구
- 원샷학습 : 반복 없이 데이터를 한 번 혹은 몇 번만 보고 학습
- 전이학습 : 한 문제를 위해 학습한 걸 다른 문제에도 바로 적용
📌 찾아보기 : 원샷학습, 전이학습이 신기함. 어떻게 작동하는 거지.
1.3 딥러닝과 신경망
머신러닝 알고리즘 중 인공 신경망이 있음. 얘 층을 여러 겹 쌓아 학습하면 심층 인공 신경망 = 딥러닝 됨.
정제되지 않은 데이터는 특징을 추출해서 머신러닝 알고리즘에 입력해야 함. = 특징 추출, 특징 공학. 대표적 예시) 윤곽선 검출
이 특징 추출을 어느 정도 자동화자동사냥 되는 게 딥러닝.
인공신경망 : 사람 뇌와 이를 구성하는 신경세포의 동작 원리에서 아이디어.
인공 신경망은 신경세포와 신경세포 사이의 정보전달을 벡터 연산으로 표현한 수학 모델. 하지만 뇌 기능을 관찰하여 새로운 알고리즘을 만들어내는 경우도 있음.
딥마인드에서 머신러닝 학자들과 뇌과학자들이 연계하여 새로운 아이디어 낸다고 함.
📌 찾아보기 : 딥마인드가 성과가 있는지, 효율이 어떤지 궁금.
-> 당장 ‘딥마인드 성과’만 쳐도 엄청 많이 나온다!
💡 해당 포스팅은 펭귄브로의 3분 딥러닝, 파이토치맛 교재를 통해 학습한 내용을 정리한 글입니다.