ai(42)
-
tensor flow 2.0 ver
from tensorflow.keras.models import Sequential model = Sequential() # 큰 box를 만들 수 있어요! # Sequential() : 순차적인이라는 뜻을 가지며 data가 순차적으로 # model을 생성한 후 그 다음에 할일은 # layer를 추가하는 거예요 # model.add() # layer를 추가할 수 있어요! # 설정을 잡아야 해요! # model.compile() # Optimizer(SGD, Adam, etc..) # loss 설정 , metrics # 학습을진행 # model.fit() # 평가진행 # model.evaluate() # 예측작업진행 # model.predict() # 모델을 저장 # model.save() Goole Ten..
2021.09.10 -
MNIST(Multinomial classification)/model평가
Multinomial classification(다중분류) → "MNIST" → Machine Learning 계의 Hello world 2차원 pixel안에 값이 있으면 1 없으면 0 해서 사람들의 숫자글씨체를 표현 높은 수일수록 더 어두움 vision : 사진 동영상같이 보이는거 class : label의 갯수, 종류 왜 만들었을까 ? 손 편지 쓰던 시절 미국에서 사람들이 우편번호 분리하기 힘들어 MNIST를 만들어 machine learning으로 학습해서 쉽게하기 위해 - mnist는 2차원 + 사람수 = 3차원 / 인데 ravel()로 mnist를1차원으로 변경 - class 가 10개이므로 binary classfication도 10개있어야 한다 == multinomial classficati..
2021.09.10 -
Multinomial classification(다중분류)
Multinomial classification(다중분류) : logistic이 여러개 모여 다중분류 독립변수 1개 → 2차원상에 점이 찍히고 linear regresiion이 직선으로 나온다 독립변수 여러개 →독립변수에 갯수에 따라 hyperplane(초평면)이 변하는데 차원이 올라갈수록 선 면 공간이 생긴다 (위 사진 참고) hyperplane(초평면) : 2진분류에서 어느쪽에 있니의 기준선 위 식은 각각을 구하는 linear regression이다 이를 아래쪽식과 같이 풀어서 사용할수 있다 linear legression모델이 학습이 끝나서 prediction한다 가정해보자 → Cross Entropy를 각각 계산하면 A일 확률0.7123 /B일 확률 0.8585 /C일 확률 0.2347로 나온다 ..
2021.09.09 -
Regulerization(규제)
https://sungin.tistory.com/142?category=1044420 SGDClassifier, StandardScaler 에서 이어지는 내용 정규화(Standardization)까지 적용해서 model이 많이 향상 되었어요 !! 추가적으로 어떤 작업이 더 정확도를 올릴까요 ?? 과적합 → 과대적합(overfitting) - trainning data에 너무 잘 맞춰저 validation에서는 평가를 잘못함 - trainning data(99%), validation data(80%)는 과대적합 = 대부분의 case → 과소적합(underfitting) - data가 적거나 학습이 덜되어 문제가 발생 하지만 굉장히 드문 경우 - trainning data, validation data 둘..
2021.09.08 -
SGDClassifier, StandardScaler
지금까지 Logistic Regression방식의 cancer(암), titanic 을 SKlearn , Tensorflow로 진행하였다 지금까지 sklearn에서 사용한 Logistic은 우리가 딱 배운만큼만 사용되는데 → gradient descent algorism은 느리다 → 이진분류(binary classification)을 위해 sklearn이 범용화된 class를 제공 (이진분류 여러 알고리즘 쓰기 적합) → SGDClassifier → Stochastic gradient descent algorithm classfier - 분류하다 / Stochastic 확률(론)적인 # SGDClassifier를 이용해서 이진분류(binary classification)작업을 진행해 보아요! import..
2021.09.08 -
titanic code
# Logistic Regression (binary classification) import numpy as np import pandas as pd import tensorflow as tf from sklearn.model_selection import train_test_split # 이상치 처리와 정규화처리는 여러분들이 나중에 한번 해 보세요! # Domain 분석부터 시작해 보아요! # Raw Data Loading df = pd.read_csv('./data/titanic/train.csv', sep=',') # display(df) train_df = df.drop(['PassengerId', 'Name', 'Ticket', 'Fare', 'Cabin'], axis=1, inplace=Fa..
2021.09.07