일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 교환학생
- 제네바경영대학교
- 아셈듀오 선정
- 키워드시각화
- 아셈듀오
- tableau
- 제네바기숙사
- 아셈듀오 후기
- HEG
- 데이터 시각화 포트폴리오
- 태블로
- 데이터공모전
- 패스트캠퍼스 #자료구조 #코딩테스트 #배열
- 교환학생 장학금
- 두잇알고리즘코딩테스트
- 공모전후기
- 데이터 분석 포트폴리오
- MairaDB
- 제네바
- CRM
- 교환학생주거
- 테이블계산
- 텍스트분석 시각화
- 파이썬
- 태블로 포트폴리오
- 데이터 포트폴리오
- 제네바주거
- 무신사 데이터분석
- 리뷰분석
- 미래에셋 공모전
- Today
- Total
목록Data Science/핸즈온 머신러닝 (4)
민듀키티
- 결정트리는 분류, 회귀, 다중출력 작업까지 가능한 다재다능한 머신러닝 알고리즘임 - 복잡한 데이터 셋도 학습할 수 있다는 장점을 가지고 있음 - 랜덤 포레스트의 기본구성요소이기도 함 1. 결정 트리 학습과 시각화 [붓꽃 데이터셋에 DecisionTreeClassifier를 훈련시키는 코드] from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier iris = load_iris() X = iris.data[:, 2:] # 꽃잎 길이와 너비 y = iris.target tree_clf = DecisionTreeClassifier(max_depth=2, random_state=42) tree_clf.fit(X..
1. 선형 SVM 분류 - SVM : 강력하고 선형이나 비선형 분류, 회귀, 이상치 탐색에도 사용할 수 있는 다목적 머신러닝 [SVM의 기본원리] - 선형 SVM분류 : 두 클래스가 직선으로, 선형적으로 구분됨 - 결정경계 : 오른쪽 그래프에 있는 실선 - 서포트 벡터 :도로 바깥쪽에 훈련 샘플을 더 추가해도 결정경계에는 전혀 영향을 미치지 않는 샘플 (1) 소프트 마진 분류 & 하드 마진 분류 - 하드 마진 분류 : 모든 샘플이 도로 바깥쪽에 올바르게 분류되어 있는 것 - 오른쪽 그래프의 결정계계는 하드마진을 찾을 수 없음 - 그렇기 때문에, 유연한 모델이 필요함 - 소프트 마진오류 : 도로의 폭을 가능한 넓게 유지하는 것과 마진오류 사이에 적절한 균형을 찾는 것 하이퍼 파라미터 설정 - C (하이퍼 ..
1. 선형회귀 간단한 선형회귀 모델의 예시 ▶ θ : 모델의 파라미터 ▶ 가중치의 합과 편향이라는 상수를 더해 예측을 만듬 이를 벡터형태로 표기한다면 ? ▶ θ와 x의 점곱으로 표현할 수 있으며, 벡터는 주로 열 벡터로 표기하기 때문에 θ를 전치시켜서 선형회귀 식을 표현 그러면, 최적의 θ을 찾는 방법은 ? ▶ RMSE를 최소화하는 θ를 찾아야 함 (1) 정규방정식 비용함수를 최소화하는 θ를 찾기 위한 해석적인 방법으로, 이를 정규방정식이라고 함 정규방정식 공식을 테스트하기 위한 코드 1) 데이터 생성하기 import numpy as np # 0에서 2까지의 크기의 행렬을 생성함 X = 2 * np.random.rand(100, 1) # noise 까지 더해주기위해 np.random.randn을 해줌..
1. MNIST - 딥러닝, 머신러닝 분야에서 예제 데이터 셋으로 많이 사용하는 것 중에 하나 - 손으로 쓴 70000개의 작은 숫자 이미지를 모은 데이터 셋임 (1) 사이킷런으로 데이터 읽기 : MNIST의 구조 from sklearn.datasets import fetch_openml mnist = fetch_openml('mnist_784', version=1, as_frame=False) mnist.keys() >>> dict_keys(['data', 'target', 'frame', 'categories', 'feature_names', 'target_names', 'DESCR', 'details', 'url']) data : 행,열로 구성된 data DESCR : 데이터셋을 설명하는 DESCR..