전체 글 - Table of Contents332 (L2 Regularization) → Ridge Regression (concepts) ** 우리는 저번 포스팅에서 Supervised Learning 중 Regression의 일종인 'linear regression'에 대해 학습했다. ☝️ 위 그림에서 보다시피 linear 선형 regression으로는 많은 종류의 model이 있음을 확인할 수 있다 🔆 우리는 이 선형회귀모델 중 대표적인 'Ridge 릿지 회귀'에 대해서 이번 포스팅을 통해 알아보려 한다! starting from Overfitting... 👏 기존 단순선형/다중선형 회귀선이 과적합이 일어날 가능성이 있어서 일반화가 잘되는 (즉, variance를 낮추는 방향) 쪽으로 tuning하는 modelling 방법이다! 👏 (↓ovefitting / underfitting 관련 개념은 아래 posting 참조) 기존에 빨간 점.. Machine Learning/Models (with codes) 2022. 4. 19. Databases and SQL for Data Science with Python (2/2) (from Coursera) * 저번 Database & SQl posting에 이어서..! 내용 계속 진행🎉 Databases and SQL for Data Science with Python (1/2) (from Coursera) 1) Getting Started with SQL Q1) What is SQL? (Structured English Query Language) = a language used for relational databases to query or get data out of a database - 더 자세한 설명은 하단 포스팅 참.. sh-avid-learner.tistory.com 4) Accessing Databases using Python SQL API consists of library funct.. Database/Fundamentals 2022. 4. 19. train vs. validation vs. test set (! -- 매우 간단한 개념 짚고 넘어가는 목적 --!) * ML modelling할 때 주어진 train set로 모델을 구축하고 미리 주어진 data에서 일부 test set으로 뽑아 나중에 model에 집어넣어 예측값을 뽑거나 해당 모델의 성능을 최종적으로 평가했다. 이런 일련의 과정 (train → test)을 앞선 모델에 계속 적용했는데, 이제는 validation set을 포함하여 이 세 종류의 set의 정확한 차이점을 알아보고 개념을 다지도록 하자! - train vs. validation vs. test - ☝️ 먼저 주어진 train 훈련 data로 모델을 학습시킴 ✌️ 기존 train 훈련 data에서 학습시킨 train data를 제외한 나머지 validation data로 학습된 모.. Machine Learning/Fundamentals 2022. 4. 18. Gradient Descent (concepts) (+momentum) * 오늘도 머신러닝에서 꼭 배우고 가야 할 'Gradient Descent' 개념에 대해서 알아보고 가자 😇 *Gradient Descent는 일종의 최적화(optimization) algorithm 중 하나로 비용함수(비용)를 최소화하는 함수의 파라미터를 찾을 때 사용된다 *😔 잘 감이 오지 않음 저번에 배운 「SLR」 모델을 예로 들자면 Simple Linear Regression (concepts) ** 우리는 저번시간에 Supervised Learning - Regression - Linear Regression까지 concepts에 대해 배웠다 (↓↓↓↓↓↓ 하단 포스팅 참조 ↓↓↓↓↓↓) ML Supervised Learning → Regression → Linear Regr.. sh-avid.. Machine Learning/Fundamentals 2022. 4. 18. pandas Tricks (Kevin by DataSchool) 완료! COMPILATION 길고 긴 Keving Pandas Tricks를 모두 끝냈다 😍 (총 14개의 trick 포스팅!) pandas라는 강력한, 극강의 library를 통해 dataframe을 자유자재로 이용할 수 있게 되었다. 추가로 더 알게되는 유용한 기능들이 있다면 계속해서 pandas tricks라는 이름 하에 올릴 예정🙋🏼♂️ https://www.youtube.com/watch?v=RlIiVeig3hc 《pandas tricks compilation》 🏄🏼♂️ 행과 열 순서 바꾸기 pandas Tricks_01 👉🏻 'Reverse (row/column) Order' (Kevin by DataSchool) Q) 데이터프레임이 주어졌다. 근데 내가 원하는 데이터는 행 기준 아래 부분. 데이터 용량이 워낙 커서 .. Python/Pandas&Numpy 2022. 4. 18. Color Scales (source from <Fundamentals of DV by Claus O.Wilke>) ☆ THREE fundamental use cases for color in data visualizations ☆ 1. as a tool to DISTINGUISH 👐 → 'distinguishing discrete items or groups that do not have an intrinsic order, such as different countries on a map or different manufacturers of a certain product' 👉 data를 서로 구분하는 용도로 색을 쓸 때는 data 간에 내재된 순서가 없을 경우이다. 순서가 존재한다면 순서가 가까운 data 간에 좀 더 유사한 색을 부여해야 하므로 data간에 서로 영향이 없을 경우 색을 고를 때 한정한다! 👉 이럴.. Visualizations/Fundamentals of DV by Claus O. Wilke 2022. 4. 18. Databases and SQL for Data Science with Python (1/2) (from Coursera) 1) Getting Started with SQL Q1) What is SQL? (Structured English Query Language) = a language used for relational databases to query or get data out of a database - 더 자세한 설명은 하단 포스팅 참조 - why SQL? & Relational Databases 🧡 Structured Query Language 🧡 🦄 1970년대에 등장했으면 다소 '올드하다'는 이미지를 가져다 줄 수 있겠지만, 전 세계 기업들 - 페이스북, 인스타, 에어비앤비, 우버 등등 -이 보유한 대용량의 data는 sh-avid-learner.tistory.com Q2) What is a Database.. Database/Fundamentals 2022. 4. 18. Basic Derivative - 미분 기초 1. intuition [1] derivative - 변수 x를 아주아주 조금 움직였을 때 f(x)의 기울기 (다 똑같은 말) - → 즉, x를 움직였을 때 f값이 얼마나 변하는 지 - 'x가 움직인 값 대비 변한 f값 정도'를 '기울기'라고 한다 → 여기서, x가 매우매우 조금만 움직였을 때(즉, x의 변화량이 극한값으로 0으로 향할 때: lim(Δx→ 0))의 y변화량을 '미분값'이라 한다 - x에서의 'derivative of function' - + 즉 여기서 h가 0을 향해 간다면? 해당 기울기는 '미분값'! [2] partial derivative - 편미분 → 한 쪽 변수만 제외하고 나머지는 변하지 않는다 가정한 상태에서, 제외한 한 쪽 변수의 변화량 (이 때 변화량은 lim(Δx→ 0)과 .. Math & Linear Algebra/Concepts 2022. 4. 18. pandas Tricks_14👉🏻 'styling a dataframe' (Kevin by DataSchool) 🤳 저번 pandas tricks 시간에는 display 형태를 어떻게 보이게 할 것인지에 대해 배웠었다. 좀 더 flexible한 강력한 dataframe styling에 대해 알아보려 한다! → pandas에는 이미 주어진 dataframe 또는 series를 CSS를 이용하여 cutomized된, 다양한 디자인 + 표시 옵션을 제공해준다. ① dictionary 형태로 format에 원하는 column명과 바뀔 style을 지정한 여러 pair들을 집어넣을 수 있다 ② dataframe 전체에서 적용시키는 여러 method들을 집어넣을 수 있다 (예를 들면 hide_index() 라던가 set_caption(), bar() 등등) pandas Tricks_13👉🏻 'change display opt.. Python/Pandas&Numpy 2022. 4. 18. Multiple Linear Regression Model (concepts+w/code) ✌️ 저번 시간에 feature가 1개인 단순선형회귀모델에 대해서 배웠다 ✌️ - 이론(개념) - Simple Linear Regression (concepts) ** 우리는 저번시간에 Supervised Learning - Regression - Linear Regression까지 concepts에 대해 배웠다 (↓↓↓↓↓↓ 하단 포스팅 참조 ↓↓↓↓↓↓) ML Supervised Learning → Regression → Linear Regr.. sh-avid-learner.tistory.com - scikit-learn python 코드 - Simple Linear Regression Model (w/scikit-learn) ** 저번 포스팅에서 단순선형회귀 '개념'에 대해 자세히 공부했었다! 😚 .. Machine Learning/Models (with codes) 2022. 4. 17. pandas Tricks_13👉🏻 'change display options' (Kevin by DataSchool) 🕺 pandas & dataframe은 뗄레야 뗄 수 없는 관계! 🕺 ≪주어진 dataframe이 육안상 어떻게 보이게 하는 지 여러 설정을 통해 바꿔보자≫ ※ 여기서 중요한건, data는 internally하게 바뀌지 않는다는 점 (육안상 보이는 형태만 바꿀 뿐!) ※ 🍉 pd.set_option() docu 🍉 https://pandas.pydata.org/pandas-docs/version/0.23/generated/pandas.set_option.html# pandas.set_option(pat, value) = → pat이라는 인자에 바꿀 option의 종류를 집어넣는다 → pat 인자에 맞는 알맞은 value를 설정해 원하는 대로 display되게 설정! ≪pat 종류≫ → 그때 그때 원하는 .. Python/Pandas&Numpy 2022. 4. 17. in where? 🦸♀️ - AI examples 1. 제조/IoT 산업 내 AI 혁신과 스마트팩토리 [1] 제조 분야 {1} 스마트팩토리 - 제조 생산을 위한 수직적 통합 및 네트워크화된 제조 시스템을 갖춤 - 제조 공정 및 운영 데이터와 통합 - 오작동모니터링(설비혁신) -> 제품성능모의실험(품질혁신) -> 데이터 기반 의사결정 최적화(운영혁신) 순서로 진행 * 오작동 모니터링 - 기계 설비의 오작동율은 환경(제조율, 습기, 온도 등)에 따라 다름 - 따라서 특정 센터 1-2개만으로 오작동을 예측하기에는 정확도의 한계가 존재 - 다양한 데이터에 기반한 AI를 사용하여 한계 극복, 오작동 시점을 예측 가능 * 제품성능모의실험 (Digital twin) - 실제 공장을 만들어 제품 생산을 테스트하는 데에는 막대한 시간과 비용 소모 - 데이터에 기반한 가.. Computer Science/Basics 2022. 4. 17. 이전 1 ··· 18 19 20 21 22 23 24 ··· 28 다음