Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- LLM
- Lora
- 판다스
- Study
- 파인튜닝
- 스터디
- English
- 코딩테스트
- speaking
- 이분탐색
- Fine-Tuning
- 플로이드와샬
- 최단경로
- 완전탐색
- 프로그래머스
- paper review
- 알고리즘
- Coursera
- Scaling Laws
- 그래프이론
- DP
- Python
- peft
- 코드트리
- 파이썬
- 코딩테스트실력진단
- Generative AI
- 머신러닝
- 데이터분석
- bfs/dfs
Archives
- Today
- Total
목록데이터스케일링 (1)
생각하는 아져씨

Data Scaling?! 데이터 스케일링은 데이터의 범위와 분포를 조정하는 작업을 의미한다. 이를 통해 모든 특성이 동일한 스케일을 갖게 되며, 모델 학습 과정을 안정화시키고 수렴 속도를 높이며, 이상치의 영향을 줄여 모델의 성능을 개선하는데 도움을 주는 전처리 방법 중 하나이다. 데이터를 분석하다 보면 feature들마다 데이터 값의 범위가 다 제각각임을 볼 수 있다. 만약 범위 차이가 크다면 모델을 학습할 때 0으로 수렴하거나 무한으로 발산할 수 있다는 문제점이 있으므로 데이터 스케일링을 해주는 것이 좋다. 여기를 참고해 총 5가지 데이터 스케일링 방법에 대해 연습했다. StandardScaler MinMaxScaler MaxAbsScaler RobustScaler Normalizer 데이터 스케일..
Machine & Deep Learning/ML & DL
2023. 10. 19. 22:05