본문 바로가기
SMALL

비지도학습3

4장_비지도학습을 이용한 군집화 비지도학습(unsupervised learning) 문제는 있지만 정답 또는 라벨(label)이 없는 데이터로 컴퓨터가 스스로 문제를 보면서 특징을 잡아내는 방법 대표적으로 군집화(clustering)를 통해 데이터에 내재된 정보를 찾음 [K-평균 알고리즘] 군집화 알고리즘 중 가장 대표적이고 오래된 알고리즘 K는 군집의 개수를 의미하며 사용자가 입력하는 유일한 입력값 ▶ K-평균 알고리즘을 구성하는 방법 몇 개의 군집으로 분류할 것인지 지정(K의 숫자는 군집의 수) 임의의 각 군집의 중심점 선택 각 벡터를 가장 가까운 군집 중심점에 연결 각 벡터와 군집 중심점 간의 거리 평균 계산 3단계의 계산 값을 고려하여 군집 중심점 업데이트 3~5단계를 특징 조건이 만족할 때까지 반복(단, 중심점 변경이 없다면 .. 2023. 2. 27.
3장_머신러닝의 이해와 지도학습을 이용한 분류 머신러닝 → 인공지능이 스스로 똑똑해질 수 있게 만드는 기술 → 데이터를 통해 컴퓨터가 '학습'을 하고 자동으로 문제를 해결 → 데이터에서 일정한 규칙을 찾아내고, 이를 바탕으로 다른 데이터를 분류하거나 미래를 예측 1. 머신러닝의 유형 머신러닝의 대표적인 세 가지 유형 지도학습 : 훈련 데이터에 정답(Label)이 있어 주어진 정답에 맞게 특징이 학습되기를 기대하는 경우에 사용 비지도학습 : 훈련 데이터에 정답이 없고 주어진 특징 내에서 분류간 서로 구분이 잘 되도록 원하는 경우에 사용 강화학습 : 학습(혹은 수집)되는 데이터에 정답은 없으나 동작하거나 반응하는 결과에 상과 벌을 주어서 스스로 진화할 수 있는 경우에 사용 아래의 그림은 머신러닝의 기술 유형을 나타낸다. * 이 책에서는 강화학습을 제외하.. 2023. 2. 21.
chap02. 자연어 처리 개발 준비_사이킷런(Scikit-learn) 이번 포스팅은 자연어 처리를 위한 도구 중 사이킷런에 대한 내용이다. [사이킷런(scikit-learn)] 사이킷런(scikit-learn)은 머신러닝 기술을 활용하는 데 필요한 다양한 기능을 제공하며, 파이썬으로 머신러닝 모델을 만들 수 있는 최적의 라이브러리다. 사이킷런 라이브러리는 지도 학습 모듈, 비지도 학습 모듈, 모델 선택과 평가 모듈, 데이터 변환 모듈로 이루어져 있으며 종류는 다음과 같다. - 지도 학습 모듈 종류 : 나이브 베이즈(Naive Bayes), 의사결정 트리(Decision Trees), 서포트 벡터 머신(Support Vector Machines) 모델 등 - 비지도 학습 모듈 종류 : 군집화(Clustering), 가우시안 혼합 모델(Gaussian mixture model.. 2021. 7. 1.
LIST