일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Generative AI
- 코딩테스트실력진단
- Study
- 완전탐색
- 최단경로
- Coursera
- Fine-Tuning
- 코딩테스트
- 데이터분석
- speaking
- 이분탐색
- Scaling Laws
- 머신러닝
- 판다스
- English
- 코드트리
- DP
- 플로이드와샬
- 프로그래머스
- Python
- 파인튜닝
- Lora
- bfs/dfs
- 스터디
- 그래프이론
- paper review
- LLM
- 파이썬
- peft
- 알고리즘
- Today
- Total
목록분류 전체보기 (99)
생각하는 아져씨

머신러닝에서 범주형 변수를 인코딩해야 하는 이유는 정말 중요하다. 왜냐하면, 머신러닝 모델은 숫자 데이터만 이해할 수 있어서, 범주형 변수를 숫자로 변환해야 한다. 모델에게 맞게 언어를 해석하도록 하는 것이다. 범주형 변수를 인코딩하면 모델이 범주 간의 관계를 파악하고 예측에 활용할 수 있다. 인코딩을 통해, 범주형 변수의 유용한 정보를 보존할 수도 있다. 때론 모델의 성능을 향상해 준다. 원-핫 인코딩과 같은 효과적인 방법을 사용하면, 범주형 변수의 다양한 범주를 이진 형태로 표현할 수 있고 모델이 이해하기 쉽게 만들어준다. 모델의 예측 정확도를 향상시키고, 데이터 분석 및 예측 프로세스를 더 효과적으로 수행하는 핵심 도구로 범주형 변수의 인코딩은 반드시 고려해야 한다. 말그대로 머신러닝의 비결이다...

머신러닝에서 모델의 성능을 높이는데 정제된 데이터, 좋은 알고리즘을 사용하는 것도 있지만 무엇보다도 데이터를 목적에 맞게 추출하고 가공하는 것도 중요하다. 오늘은 데이터를 분석할 때 빈번하게 등장하는 groupby, merge, agg를 사용해서 간단한 문제를 연습해봤다. Problem. 2개의 데이터 프레임이 있다. '년도' 컬럼을 기준으로 그룹화하여 나라명 개수, 행복기대치의 평균/표준편차/중간값을 구해보자. 정답은 다음의 형태를 띄도록 출력해보자. 정답은 다음의 형태를 띄도록 하시오. |년도|나라명 개수|mean|std|median| |---|---|---|---|---| |내용 1|내용 2|내용 3|내용 4|내용 5| |내용 5|내용 6|내용 7|내용 8|내용 9| |내용 9|내용 10|내용 11..

그래프와 BFS/DFS 코딩 테스트를 풀다 보면 어떤 문제는 BFS가 적절하고, 어떤 문제는 DFS 이고 어쩔 땐 둘 다 가능한 경우가 있다. 이 경우를 헷갈리지 않기 위해 상황 별 정리를 해본다. 이 글 에서 그래프의 최단경로를 구하는 방법이 잘 정리되어 있어서 참고했다. 1. BFS 너비 우선 탐색으로, 그래프에서 쓰일 수 있는 탐색 알고리즘이다. BFS는 '가중치가 없는 그래프의 최단경로를 찾는 경우'에 사용될 수 있다. 그래서 최단거리의 합(또는 길이)를 출력하거나 최단 거리의 경로가 무엇인지 출력하는 문제에 적합하다. 최단거리를 출력하는 방법 새로운 노드를 탐색할 때, 그 전 단계의 거리에 +1 을 해주면 된다. 최단거리 경로를 출력하는 방법 직접 풀어보고 적기 2. DFS 3. 구현 시 도움..

문제 https://www.codetree.ai/missions/2/problems/determine-escapableness-with-2-ways?&utm_source=clipboard&utm_medium=text 코드트리 | 코딩테스트 준비를 위한 알고리즘 정석 국가대표가 만든 코딩 공부의 가이드북 코딩 왕초보부터 꿈의 직장 코테 합격까지, 국가대표가 엄선한 커리큘럼으로 준비해보세요. www.codetree.ai 풀이 DFS 기초를 확인할 수 있는 쉬운 문제였다. 마지막 탈출 격자까지 도달했는지 유무를 더 쉽게 확인할 수 있는 방법을 기억하기 위해 기록한다. 내가 짠 방법 : global result 변수를 사용해 매번 만나는 (x, y) 좌표가 탈출 좌표 이면 result를 변경 더 쉬운 방법 : ..

앤드류 응 교수님의 강의를 듣고 정리 및 공부한 글임을 알려드립니다. Generative AI with LLMs In Generative AI with Large Language Models (LLMs), created in partnership with AWS, you’ll learn the fundamentals of how generative AI works, and how to deploy it in real-world applications. 지금까지 Pre-training과 Fine-tuning을 통해 모델의 성능을 높이는 방법을 공부했습니다. 사전학습 모델을 파인튜닝하면 더 나은 성능을 얻을 수 있음을 확인했는데, 그렇다면 어떻게 “성능 향상”을 얻었다고 확인할 수 있을까요? 이를 위해서 L..

문제 https://www.codetree.ai/training-field/frequent-problems/problems/maze-runner?&utm_source=clipboard&utm_medium=text 코드트리 | 코딩테스트 준비를 위한 알고리즘 정석 국가대표가 만든 코딩 공부의 가이드북 코딩 왕초보부터 꿈의 직장 코테 합격까지, 국가대표가 엄선한 커리큘럼으로 준비해보세요. www.codetree.ai 풀이 해설 & 느낀 점 삼성 2023년 상반기 기출문제 1번 - 메이즈 러너이다. 삼성 문제를 처음 풀어본 것 같은데 이렇게 많은 조건과 함수가 필요한 구현 문제는 처음이었다. 😂 풀면서 머리가 복잡해지고 주춤거리게 되는데, 이럴수록 설계를 체계적으로 꼼꼼하게 해야 될 것 같다. 해설은 류호석 ..