Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 로또 프로그램
- 변수의특징
- 증감연산자
- 비교연산자
- switch-case문
- if문
- 삼항 연산자
- 피보나치수열
- JAVA기초
- 논리연산자
- #Java
- 별찍기
- 복합대입연산자
- plusgame
- 소인수분해
- 이진수
- for문 369게임
- #java_festival
- 데이터타입
- #이차원배열
- java조건문
- switch문
- 알고리즘
- java
- #알고리즘
- 연산자
- #완전수구하기
- 팩토리얼
- 2차원배열
- else if문
Archives
- Today
- Total
숭어 개발 블로그
[머신러닝] 선형분류 실습 _ <손글씨 데이터 예측(2)_스케일링,규제 튜닝> 본문
스케일링
- 데이터 범위의 스케일을 바꿔주는 작업
예시) 키와 시력 모두 0에서 1사이의 값으로 바꿔주는 작업
스케일링의 종류
Standard Scaler : 평균과 표준편차를 이용 /평균값이기 때문에 극단적인 값 (이상치) 에 민감하게 반응한다.
MinMax Scaler : 데이터 값을 0과 1사이의 범위값으로 변환(음수값이 있으면 -1에서 1값으로 변환)
Robust Scaler : 중앙값(50%)을 이용 / 이상치가 있어도 괜찮다.
Normalizer : 모든 데이터의 거리가 원점으로부터 1로 변환=> 각도만 달라진다. (거리값 무시 , 방향만 생각 / 부채꼴 모양)
데이터 스케일링( Data scaling) 주의점
- 훈련데이터와 == 테스트데이터에 같은 스케일링을 하여야한다.
스케일링 해보기
- train 데이터 변환 결과 0부터 1사이 값이 나오는걸 확인 할 수 있다.
- test 데이터도 똑같이 변환
규제 튜닝 하기
- 튜닝 결과를 보고 최고의 C값을 찾아준다
위에서 찾은 C = 0.1을 대입하여 최종 모델을 학습 / 예측 시키고 kaggle에 올릴 정답 파일 생성
규제 튜닝한 결과가 상승함을 알 수 있었다.
최종 모델 final_logi로 예측 결과
X_train.iloc[0] 은 손글씨 ' 1 ' 로
X_train.iloc[1] 은 손글씨 ' 0 ' 으로 예측
predict_proba를 통해
손글씨 유형별 (0~9) 각각의 확률도 확인할 수 있다.
실제 X_train의 0번째1번째 인덱스는 1과 0을 확인 할 수 있다.
'Machine Learning > 선형 분류' 카테고리의 다른 글
[머신러닝] 선형분류 실습 < 손글씨 데이터 예측(4)_모델저장하기 > (0) | 2022.09.22 |
---|---|
[머신러닝] 선형분류 실습 < 손글씨 데이터 예측(3)_분류평가지표 > (0) | 2022.09.22 |
[머신러닝] 선형분류 실습 _ <손글씨 데이터 예측(1)> (0) | 2022.09.21 |
[머신러닝] 선형 분류 모델 (1) | 2022.09.21 |
Comments