'자격증' 카테고리의 글 목록

빅분기 실습 파일 최종

자격증/빅데이터 분석 필기

빅분기 실습 10 - 로지스틱 회귀

## 로지스틱 회귀import pandas as pdimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.datasets import load_breast_cancerfrom sklearn.linear_model import LogisticRegressioncancer = load_breast_cancer()from sklearn.preprocessing import StandardScalerfrom sklearn.model_selection import train_test_split# StandardScaler( )로 평균이 0, 분산 1로 데이터 분포도 변환scaler = StandardScaler()data_scaled = scaler.fit..

자격증/빅데이터 분석 필기

빅분기 실습 9 - Gradient Descent

## 5.3 Gradient Descent**실제값을 Y=4X+6 시뮬레이션하는 데이터 값 생성**import numpy as npimport matplotlib.pyplot as plt%matplotlib inlinenp.random.seed(0)# y = 4X + 6 식을 근사(w1=4, w0=6). random 값은 Noise를 위해 만듬X = 2 * np.random.rand(100,1)y = 6 +4 * X+ np.random.randn(100,1)# X, y 데이터 셋 scatter plot으로 시각화plt.scatter(X, y)X.shape, y.shape** w0과 w1의 값을 최소화 할 수 있도록 업데이트 수행하는 함수 생성.*** 예측 배열 y_pred는 np.dot(X, w1.T) ..

자격증/빅데이터 분석 필기

빅분기 실습 7 - 결정트리

### 결정 트리 모델의 시각화(Decision Tree Visualization)from sklearn.tree import DecisionTreeClassifierfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitimport warningswarnings.filterwarnings('ignore')# DecisionTree Classifier 생성dt_clf = DecisionTreeClassifier(random_state=156)# 붓꽃 데이터를 로딩하고, 학습과 테스트 데이터 셋으로 분리iris_data = load_iris()X_train , X_test , y_train , y_te..

자격증/빅데이터 분석 필기

빅분기 실습 6 - 피마 인디언 당뇨병 예측

import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_score, precision_score, recall_score, roc_auc_scorefrom sklearn.metrics import f1_score, confusion_matrix, precision_recall_curve, roc_curvefrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import Lo..

자격증/빅데이터 분석 필기

빅분기 실습 5 - 정확도

## 3-1 Accuracy(정확도)import sklearnprint(sklearn.__version__)import numpy as npfrom sklearn.base import BaseEstimatorclass MyDummyClassifier(BaseEstimator): # fit( ) 메소드는 아무것도 학습하지 않음. def fit(self, X , y=None): pass # predict( ) 메소드는 단순히 Sex feature가 1 이면 0 , 그렇지 않으면 1 로 예측함. def predict(self, X): pred = np.zeros( ( X.shape[0], 1 )) for i in range (X.shape[..

자격증/빅데이터 분석 필기

빅분기 실습4 - 데이터 전처리

### 데이터 인코딩* 레이블 인코딩(Label encoding)from sklearn.preprocessing import LabelEncoderitems=['TV','냉장고','전자렌지','컴퓨터','선풍기','선풍기','믹서','믹서']# LabelEncoder를 객체로 생성한 후 , fit( ) 과 transform( ) 으로 label 인코딩 수행. encoder = LabelEncoder()encoder.fit(items)labels = encoder.transform(items)print('인코딩 변환값:',labels)print('인코딩 클래스:',encoder.classes_)print('디코딩 원본 값:',encoder.inverse_transform([4, 5, 2, 0, 1, 1, ..

자격증/빅데이터 분석 필기

빅분기 실습 3 - Model Selection 소개

## 2.4 Model Selection 소개### 학습/테스트 데이터 셋 분리 – train_test_split()from sklearn.datasets import load_irisfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.metrics import accuracy_scoreiris = load_iris()dt_clf = DecisionTreeClassifier()train_data = iris.datatrain_label = iris.targetdt_clf.fit(train_data, train_label)# 학습 데이터 셋으로 예측 수행pred = dt_clf.predict(train_data)print('예측 정확도:',accura..

자격증/빅데이터 분석 필기

빅분기 실습 2 - 사이킷런의 기반 프레임워크 익히기

from sklearn.datasets import load_irisiris_data = load_iris()print(type(iris_data))keys = iris_data.keys()print('붓꽃 데이터 세트의 키들:', keys)print('\n feature_names 의 type:',type(iris_data.feature_names))print(' feature_names 의 shape:',len(iris_data.feature_names))print(iris_data.feature_names)print('\n target_names 의 type:',type(iris_data.target_names))print(' feature_names 의 shape:',len(iris_data.ta..

자격증/빅데이터 분석 필기

Prev 1 2 3 Next

티스토리툴바