Machine Learning29

EXP001 - ≪Ridge 효과(1)≫ - coefficients 변화 & 성능 향상 확인하기 🤙 저번 포스팅에서 우리는 Multiple Regression 다항회귀모델에 대해 공부했다. Multiple Linear Regression Model (concepts+w/code) ✌️ 저번 시간에 feature가 1개인 단순선형회귀모델에 대해서 배웠다 ✌️ - 이론(개념) - Simple Linear Regression (concepts) ** 우리는 저번시간에 Supervised Learning - Regression - Linear Regression.. sh-avid-learner.tistory.com 🤙 그리고 Ridge 모델 소개 시간에 SLR 모델에 Ridge 규제를 정해 Ridge의 효과를 실험으로 증명했고, 후반부에 MLR 모델에 관해서도 잠깐 언급했었다 (L2 Regularizati.. Machine Learning/Experiments 2022. 4. 22.
feature selection (1) - selectKBest (+jointplot) 🤳 예전 포스팅에서 '특성공학(feature engineering)'이 무엇인지에 대해 간략하게 개념 학습을 하였다. FE - Feature Engineering 1. Concepts * In real world, data is really messy - we need to clean the data * FE = a process of extracting useful features from raw data using math, statistics and domain knowledge - 즉, 도메.. sh-avid-learner.tistory.com 🏃‍♂️ 우리가 실생활의 data를 가지고 모델링하는 machine learning의 세계에서 무수히 많은 feature를 만날텐데, 이 모든 featur.. Machine Learning/Fundamentals 2022. 4. 20.
Ordinal Encoding 👀 머신러닝 모델은 모든 input과 output이 numeric 수치형이어야 한다는 전제조건이 깔려 있다! 즉, 우리가 마주한 data가 categorical variable이라면 모델에 집어넣기 전에 미리 numeric 수치형으로 바꾸어주는 작업이 필요한 것이다. 🕵️‍♂️ 그 중 대표적인 예로 One-Hot Encoding 기법에 대해 배웠다 One-Hot encoding ≫ ML 데이터 전처리 part에서 model이 이해할 수 있는 data로 변환하기 위해 여러 encoding 기법들이 적용된다고 하였고, 오늘은 그 중 하나인 'One-Hot encoding' 기법에 대해서 배우려고 한다 intro. Machine L. sh-avid-learner.tistory.com - 총 6가지 data t.. Machine Learning/Fundamentals 2022. 4. 20.
(L2 Regularization) → Ridge Regression (w/scikit-learn) 😼 저번 포스팅에서 Ridge 회귀가 무엇인지 개념에 대해 정확히 알아보았다 😼 (L2 Regularization) → Ridge Regression (concepts) ** 우리는 저번 포스팅에서 Supervised Learning 중 Regression의 일종인 'linear regression'에 대해 학습했다. ☝️ 위 그림에서 보다시피 linear 선형 regression으로는 많은 종류의 model이 있음을 확인할.. sh-avid-learner.tistory.com → 이젠 Ridge 회귀를 실제 python code로 구현해서 얼마나 model이 잘 예측을 하는지, 과연 과적합에서 벗어나 더 나은 model을 만들 수 있는 건지 이번 포스팅을 통해 알아보려 한다 → Ridge 모델을 만드는.. Machine Learning/Models (with codes) 2022. 4. 20.
(L2 Regularization) → Ridge Regression (concepts) ** 우리는 저번 포스팅에서 Supervised Learning 중 Regression의 일종인 'linear regression'에 대해 학습했다. ☝️ 위 그림에서 보다시피 linear 선형 regression으로는 많은 종류의 model이 있음을 확인할 수 있다 🔆 우리는 이 선형회귀모델 중 대표적인 'Ridge 릿지 회귀'에 대해서 이번 포스팅을 통해 알아보려 한다! starting from Overfitting... 👏 기존 단순선형/다중선형 회귀선이 과적합이 일어날 가능성이 있어서 일반화가 잘되는 (즉, variance를 낮추는 방향) 쪽으로 tuning하는 modelling 방법이다! 👏 (↓ovefitting / underfitting 관련 개념은 아래 posting 참조) 기존에 빨간 점.. Machine Learning/Models (with codes) 2022. 4. 19.
train vs. validation vs. test set (! -- 매우 간단한 개념 짚고 넘어가는 목적 --!) * ML modelling할 때 주어진 train set로 모델을 구축하고 미리 주어진 data에서 일부 test set으로 뽑아 나중에 model에 집어넣어 예측값을 뽑거나 해당 모델의 성능을 최종적으로 평가했다. 이런 일련의 과정 (train → test)을 앞선 모델에 계속 적용했는데, 이제는 validation set을 포함하여 이 세 종류의 set의 정확한 차이점을 알아보고 개념을 다지도록 하자! - train vs. validation vs. test - ☝️ 먼저 주어진 train 훈련 data로 모델을 학습시킴 ✌️ 기존 train 훈련 data에서 학습시킨 train data를 제외한 나머지 validation data로 학습된 모.. Machine Learning/Fundamentals 2022. 4. 18.
Gradient Descent (concepts) (+momentum) * 오늘도 머신러닝에서 꼭 배우고 가야 할 'Gradient Descent' 개념에 대해서 알아보고 가자 😇 *Gradient Descent는 일종의 최적화(optimization) algorithm 중 하나로 비용함수(비용)를 최소화하는 함수의 파라미터를 찾을 때 사용된다 *😔 잘 감이 오지 않음 저번에 배운 「SLR」 모델을 예로 들자면 Simple Linear Regression (concepts) ** 우리는 저번시간에 Supervised Learning - Regression - Linear Regression까지 concepts에 대해 배웠다 (↓↓↓↓↓↓ 하단 포스팅 참조 ↓↓↓↓↓↓) ML Supervised Learning → Regression → Linear Regr.. sh-avid.. Machine Learning/Fundamentals 2022. 4. 18.
Multiple Linear Regression Model (concepts+w/code) ✌️ 저번 시간에 feature가 1개인 단순선형회귀모델에 대해서 배웠다 ✌️ - 이론(개념) - Simple Linear Regression (concepts) ** 우리는 저번시간에 Supervised Learning - Regression - Linear Regression까지 concepts에 대해 배웠다 (↓↓↓↓↓↓ 하단 포스팅 참조 ↓↓↓↓↓↓) ML Supervised Learning → Regression → Linear Regr.. sh-avid-learner.tistory.com - scikit-learn python 코드 - Simple Linear Regression Model (w/scikit-learn) ** 저번 포스팅에서 단순선형회귀 '개념'에 대해 자세히 공부했었다! 😚 .. Machine Learning/Models (with codes) 2022. 4. 17.
One-Hot encoding ≫ ML 데이터 전처리 part에서 model이 이해할 수 있는 data로 변환하기 위해 여러 encoding 기법들이 적용된다고 하였고, 오늘은 그 중 하나인 'One-Hot encoding' 기법에 대해서 배우려고 한다 intro. Machine Learning 1. 개론 → ML은 빅데이터를 분석할 수 있는 강력한 tool의 일종이다. 기존 통계학 및 시각화로는 해결할 수 없는 한계를 보완함! 👏 데이터를 기반으로 앞으로의 미래를 예측하는 기법 👋 주어진 sh-avid-learner.tistory.com concepts 'One hot encoding can be defined as the essential process of converting the categorical data variable.. Machine Learning/Fundamentals 2022. 4. 17.
Cross-Validation (concepts + w/code) * 머신러닝을 위해서 무.조.건. 알아야 하는 CROSS-VALIDATION! 간단히 개념만 알아보ZA * * concepts> - 2번 과정 - model selection에서 주로 많이 쓰이는 cross-validation 기법 - 🧐 PURPOSE? 'The purpose of cross–validation is to test the ability of a machine learning model to predict new data. Q. 그러면 CV(Cross-Validation)에서는 무엇을 가지고 여러 모델의 성능을 평가할 수 있을까? A. 두 가지 필요 - train data & test data (from the dataset) 1) estimate the parameters for ML .. Machine Learning/Fundamentals 2022. 4. 17.
Overfitting/Underfitting & Bias/Variance Tradeoff 1. 일반화(generalization) "In machine learning, generalization is a definition to demonstrate how well is a trained model to classify or forecast unseen data. Training a generalized machine learning model means, in general, it works for all subset of unseen data. An example is when we train a model to classify between dogs and cats. If the model is provided with dogs images dataset with only two br.. Machine Learning/Fundamentals 2022. 4. 17.
All About Evaluation Metrics(1/2) → MSE, MAE, RMSE, R^2 ** ML 모델의 성능을 최종적으로 평가할 때 다양한 evaluation metrics를 사용할 수 있다고 했음! ** (supervised learning - regression problem에서 많이 쓰이는 평가지표들) - 과정 (5) - 😙 그러면 차근차근! 각 평가지표에 대해서 자세히 알아보려고 함! 😙 - ①MSE ②MAE ③RMSE ④R-Squared - 1. MSE(Mean-Squared Error) 🤔 linear regression model concept에 대해서 배울 때 관측치와 예측치의 차이들의 합인 SSE를 최소로 하는 'least squares method'를 기반으로 선형회귀모델을 결정한다고 배웠다 ≫ 이 SSE를 전체 데이터 개수 n으로 나눈 값, 즉 '관측치와 예측치의 차이.. Machine Learning/Fundamentals 2022. 4. 16.