전체 글 - Table of Contents332

Tabular Data 🗄️ Tabular Data is... 1. Data organized into a table 2. Table is a grid of data 3. Column must be same type (homogenous data) 4. (but) Row can contain many types (heterogenous data) (ofc each elements of the tabular data has different types) - Tabular Data example - Tabular Data is composed of... 1) observations - a row 2) variables - a column 3) relationships - relationship between the tables (con.. Computer Science/Concepts 2022. 3. 26.
Seaborn vs Matplotlib 👏 정리 너무 잘해놓은 GeeksforGeeks 포스팅 글 그대로 발췌 👏 👐 Data Visualization is the graphic representation of data. It converts a huge dataset into small graphs, thus aiding in data analysis and predictions. It is an indispensable element of data science that makes complex data more understandable and accessible. Matplotlib and Seaborn act as the backbone of data visualization through Python. 👍Matplotlib: It .. Visualizations/Fundamentals 2022. 3. 26.
[기획] 제안 요청서 작성하기 1. 서론 및 학습목표 → [기획] 사업 계획서 수립하기 [기획] 사업계획 수립하기 1. 서론 [1] 프로젝트 & 프로세스 → 프로젝트는 목표 달성, 즉 성공을 위하여 수행하는 고유한 프로세스의 집합으로 구성 → 여러 프로세스는 시작일 & 종료일이 정해져 있고, 각 프로세스에서 sh-avid-learner.tistory.com → 학습목표 1️⃣ 사업계획서를 토대로 사업 범위, 내용. 기간, 요건 등에 부합하도록 제안 요청서를 작성할 수 있다 2️⃣ 입찰 방식, 제안서 평가방법, 기술성 평가기준, 제출서류, 제안서 제출일정 및 방법, 제안 설명회 등 세부내용을 작성할 수 있다. 3️⃣ 사업의 목적물에 대한 기능적, 비기능적 요구사항을 정리하여 목록을 작성할 수 있다. 2. 제안 요청서(RFP: Reque.. IT knowledge/(etc) 2022. 3. 26.
[기획] 사업계획 수립하기 1. 서론 [1] 프로젝트 & 프로세스 → 프로젝트는 목표 달성, 즉 성공을 위하여 수행하는 고유한 프로세스의 집합으로 구성 → 여러 프로세스는 시작일 & 종료일이 정해져 있고, 각 프로세스에서는 통제된 특정한 활동이 진행되게 됨 [2] 프로젝트 전제된 사항 → 요구사항 충족도: 프로젝트는 요구사항을 충족해야 한다 → 상호의존도: 어떠한 단계에 변경사항이 발생하면 다른 단계도 영향을 받는다 (플젝에 투입된 물적, 인적자원에 변동이 생기면 일정에도 변동이 생김) → 의사결정: 여러 이해관계자 간 의견의 일치 [3] 프로젝트 제약사항 → 프로젝트의 기간 → 목표달성을 위한 예산 → 목표달성을 위해 필요한 인력 → 현재 내부자원은 어느 정도이며 충분한지? → 얼마만큼의 현물 & 현금이 언제, 어디에 필요한지?.. IT knowledge/(etc) 2022. 3. 25.
pandas Tricks_04 👉🏻 'Build a DataFrame from multiple files (row-wise & column-wise) ' (Kevin by DataSchool) Q. 여러 csv파일을 가져와 한 개의 dataframe에 나타내고 싶으면? A) 👇 glob package의 glob module 사용! from glob import glob ♣ glob docu 👇👇 ♣ https://docs.python.org/3/library/glob.html ▧ glob module ▧ "The glob module finds all the pathnames matching a specified pattern according to the rules used by the Unix shell, although results are returned in arbitrary order(그래서 glob쓰면 sorted() 추천!). No tilde expansion is done, b.. Python/Pandas&Numpy 2022. 3. 25.
Data Preprocessing * concepts🤲 ⊙ Although EDA and Data Preprocessing are two distinct terms, they involve many overlapping subtasks. At times, they are even used interchangeably ⊙ → 즉! 모아진 raw data를 data preprocessing 단계를 거치고 난 뒤, preprocessed된 data를 통해 EDA 과정을 거치고 또 data preprocessing하는 과정을 거치는 것처럼 서로 상호작용하며 같이 꼭 행해져야 하는 과정이라 할 수 있다 (EDA 과정 내에 data preprocessing이 들어간다고도 말하기도 함!) - 하지만 확실한 건 EDA에 들어가는 data insight.. Computer Science/Concepts 2022. 3. 25.
box plot (+seaborn) * 저번 EDA 개념 포스팅에서 EDA가 무엇인지 알아보았고, data 종류별 & 상황별 적절한 시각화 예에 대해서 공부했다. https://sh-avid-learner.tistory.com/entry/EDA-Exploratory-Data-Analysis EDA - Exploratory Data Analysis 1. concepts & goals → 탐색적 데이터 분석 - 수집한 데이터를 본격적으로 분석하기 전에 자료를 직관적으로 바라보는 과정이 필요한데, 이때 EDA를 사용한다 - 데이터 분석의 한 종류로 복잡한 모 sh-avid-learner.tistory.com - 저번 EDA 포스팅 (IQR, outlier 등등 여러 수치를 알 수 있지만, mode는 알 수 없음) - → 즉 unimodal di.. Visualizations/Various Graphs 2022. 3. 25.
<추정과 검정> - 표본추출법 (w/ python code) (1/2) - (아래) (제 1 - 2 - 3 - 4분면 순서대로) 단순임의추출법 - 계통추출법 - 집락추출법 - 층화추출법 - ** 앞선 포스팅에서 우리는 통계적 추론에 대해서 배웠고, 모집단에서 표본을 추출하여 여러 통계학적 방법을 이용해 모집단을 추측하는 것이 '통계학'이라고 배웠다. https://sh-avid-learner.tistory.com/entry/%EC%B6%94%EC%A0%95%EA%B3%BC-%EA%B2%80%EC%A0%95-%EC%B6%94%EB%A1%A0-%EA%B0%9C%EC%9A%94 Statistics/Concepts(+codes) 2022. 3. 25.
pandas Tricks_03 👉🏻 'Convert Strings→numbers ' (Kevin by DataSchool) Q. 숱하게 많이 보이는 string형 data type...! 하지만 우리는 계산을 위해서 무조건 수치형으로 바꿔야 한다.. 하지만 너무 많은 방법들이 있다. 어떤게 제일 효과적이고 좋은 방법일까? 이 포스팅으로 한 방에 해결하자..! A. 👉🏻 to_numeric 먼저 string type의 수를 모두 입력 (한 개는 -) df = pd.DataFrame({'col_one':['1.1','2.2','3.3'], 'col_two':['4.4','5.5','6.6'], 'col_three':['7,7','8.8','-']}) 1. astype() ♠astype() docu - https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.astype.htm.. Python/Pandas&Numpy 2022. 3. 25.
pandas Tricks_02 👉🏻 'Select columns by Data Type' (Kevin by DataSchool) Q. 오늘도 데이터프레임이 주어졌다. 근데 특정 데이터 타입을 갖는 칼럼만 뽑아내고 싶다.. 어떻게 하면 될까...? A) 👉🏻 'select_dtypes' method 사용! 1> seaborn 'titanic' dataset 불러오면 (seaborn.load_dataset docu 👉🏻 https://seaborn.pydata.org/generated/seaborn.load_dataset.html) import pandas as pd import seaborn as sns titanic = sns.load_dataset('titanic') titanic.head() 2> 먼저 column dtypes 확인! #2) select columns by data type titanic.dtypes 3> se.. Python/Pandas&Numpy 2022. 3. 25.
Bayesian Theorem '(example - 2 exercises) Q1) At a certain stage of a criminal investigation, ①the inspector in charge is 60% convinced of the guilty of a certain suspect. Suppose now that a new piece of evidence that shows that ②the criminal has a left-handedness is uncovered. If ③20% of population possesses this characteristic, ④how certain of the guilt of the suspect should the inspector now be if it turns out that the suspect is amo.. Statistics/Exercises 2022. 3. 24.
시계열 데이터 - datetime ▧ python에서는 특별하게 datetime이라는 type이 존재한다 ▧ from datetime import datetime → 시계열 데이터로 바꾸기 위해서는 'xxxx-xx-xx (년-월-일)' data에 datetime()을 붙인다 dt = datetime(2022,1,24,21,30,42) dt.year #2022 dt.month #1 dt.day #24 dt.hour #21 dt.minute #30 dt.second #42 → 시계열 data는 indexing / slicing이 가능! (문자열과 다른 점) ex) pandas_datareader를 이용해 data를 import하고 '삼성증시' dataframe을 가져온다고 하면 !pip install pandas_datareader from.. Python/Fundamentals 2022. 3. 24.