전체 글 - Table of Contents332 pandas Tricks_05 & 06👉🏻 'Create a DataFrame from the clipboard & Split a DataFrame into 2 random subsets' (Kevin by DataSchool) Q05) 빨리 한 dataframe을 만들고 싶을 때, 특히 연속하는 숫자, 문자 등 여러 일련의 data를 복붙해서 df로 만들고 싶다면? A) 👇 read_clipboard() 사용! pd.read_clipboard() ◈ read_clipboard docu ◈ https://pandas.pydata.org/docs/reference/api/pandas.read_clipboard.html 1> 원하는 일련의 표를 Google SpreadSheet나 Excel에 만든다 더보기 2> Ctrl + C! 3> read_clipboard() 입력하면 끝! df = pd.read_clipboard() 4> 완성! → index는 알아서 0부터 생성됨 → dtypes 결과 data의 속성에 맞게 자동적으로 dty.. Python/Pandas&Numpy 2022. 3. 30. <추정과 검정> - 표본추출법 (w/ python code) (2/2) - 오늘은 하단 두개 (좌) 집락추출법 (우) 층화추출법에 대해서 배워보자 - Q) 모집단에서 표본을 추출하는 또 다른 두가지 방법? A) 집락추출법/층화추출법 (단순임의추출/계통추출은 하단 포스팅 참조 ↓↓↓↓↓↓) - 표본추출법 (w/ python code) (1/2) - (아래) (제 1 - 2 - 3 - 4분면 순서대로) 단순임의추출법 - 계통추출법 - 집락추출법 - 층화추출법 - ** 앞선 포스팅에서 우리는 통계적 추론에 대해서 배웠고, 모집단에서 표본을 추출하여 여러 통 sh-avid-learner.tistory.com ☝️ 여기서, 모집단을 대표할 수 있도록 표본을 추출하는 것이 가장 중요하다..! (표본추출'방법'에 따라 분석 결과 및 해석에 큰 차이가 발생할 수 있기 때문) ✌️ code.. Statistics/Concepts(+codes) 2022. 3. 30. why SQL? & Relational Databases 🧡 Structured Query Language 🧡 🦄 1970년대에 등장했으면 다소 '올드하다'는 이미지를 가져다 줄 수 있겠지만, 전 세계 기업들 - 페이스북, 인스타, 에어비앤비, 우버 등등 -이 보유한 대용량의 data는 database에 저장됨 - 이 data를 접근하려면 SQL을 사용해야 함 (따라서 sql 공부는 그냥 필수다 필수 🏋️♀️) 기업공고만 본다 하더라도 python, R보다도 더 많이 요구하는 SQL! SQL is → helps you filter and fetch only the data you need from databases → a language designed to allow both technical and non-technical users query, mani.. Database/SQL 2022. 3. 30. [일정] 공정 정의하기 → 시스템의 개발목표, 기술적 특성, 개발팀의 상황을 고려하여 공정 선정 → IT 프로젝트의 일정, 인력, 이행조건 등 제약사항을 파악하여 부합하도록 표준 공정을 조정 및 수정 → IT 프로젝트 수행에 필요한 상세 작업들을 도출하여 표준공정 변경 → 최종 확정된 전체 수행 활동을 작업분류체계(WBS; Work Breakdown Structure)로 구조화 1. 표준 공정 정의 - Standard Process Plan [1] SW 개발 방법론 → 구조적 개발 SD → 모델 기반 개발 MBD → 컴포넌트 기반 개발 CBD → 서비스 지향 개발 SOD → 순차적 개발 (구조적, 정보 공학) - 수행할 태스크 및 완료 지점이 명확히 파악됨 - 대규모 시스템 개발 플젝에 적합한 프레임워크 제공 - 실제 SW 개.. IT knowledge/(etc) 2022. 3. 30. [통합] 프로젝트 통제하기 [통합관리] → 프로젝트 계획 수립하기 [통합] 프로젝트 계획 수립하기 (통합관리 - 계획수립) 1. 서론 및 학습목표 → 통합관리 하고자 하는 IT 프로젝트 관리 대상 요소를 식별할 수 있다 → 통합관리를 위한 관리 체계를 정의하고, 관리를 위한 세부 프로세스를 정립할 수 있다 → 프로젝 sh-avid-learner.tistory.com → 프로젝트 수행하기 [통합] 프로젝트 수행하기 저번 시간 - [통합] 프로젝트 계획 수립하기 (포스팅 ↓↓↓↓) [통합] 프로젝트 계획 수립하기 (통합관리 - 계획수립) 1. 서론 및 학습목표 → 통합관리 하고자 하는 IT 프로젝트 관리 대상 요소 sh-avid-learner.tistory.com ** 학습목표 → 수집된 의사결정 사안에 대한 모니터링 데이터를 분석할.. IT knowledge/(etc) 2022. 3. 29. [통합] 프로젝트 수행하기 저번 시간 - [통합] 프로젝트 계획 수립하기 (포스팅 ↓↓↓↓) [통합] 프로젝트 계획 수립하기 (통합관리 - 계획수립) 1. 서론 및 학습목표 → 통합관리 하고자 하는 IT 프로젝트 관리 대상 요소를 식별할 수 있다 → 통합관리를 위한 관리 체계를 정의하고, 관리를 위한 세부 프로세스를 정립할 수 있다 → 프로젝 sh-avid-learner.tistory.com ≫ IT 프로젝트 수행 시 관리 대상 요소 간 상충 또는 누락, 중복되는 의사결정 사안을 파악할 수 있다 ≫ 유형별로 파악된 의사결정 사안에 대한 지속적인 모니터링을 수행할 수 있다 ≫ 유형별 의사결정 사안에 대한 모니터링 결과를 수집하여 데이터화할 수 있다 1. 프로젝트 수행 * 프로젝트 관리 계획서에 정의된 작업을 수행하고, 승인된 변경 .. IT knowledge/(etc) 2022. 3. 28. violin plot (+seaborn) * EDA에 대해 알아보았고 EDA 과정에서 많이 쓰이는 시각화 방법 중 box plot에 대해 자세히 알아보았다. box plot (+seaborn) * 저번 EDA 개념 포스팅에서 EDA가 무엇인지 알아보았고, data 종류별 & 상황별 적절한 시각화 예에 대해서 공부했다. https://sh-avid-learner.tistory.com/entry/EDA-Exploratory-Data-Analysis EDA - Explorat.. sh-avid-learner.tistory.com ** 이젠 box plot과 매우 유사한 형태인 'violin plot'에 대해서 알아보자! → box plot과 마찬가지로 violin plot도 unimodal distribution을 갖는 continuous varia.. Visualizations/Various Graphs 2022. 3. 27. Q. Matplotlib graph 한글깨짐현상 & (-) 부호 해결법 (IDE - Jupyter Notebook) cf) 미국에 최적화된 IDE에 한글을 일일이 대입해줘야 한다.. ㅠㅠ 😐 (조건) IDE - Jupyter Notebook & Windows 환경 (Mac & Linux환경이나 colab에서 실습) A. ↓↓↓↓ 아래 code 복붙 ↓↓↓↓ import matplotlib from matplotlib import font_manager, rc matplotlib.rcParams['axes.unicode_minus'] = False font_name = font_manager.FontProperties(fname="c:/Windows/Fonts/malgun.ttf").get_name() rc('font', family=font_name) -- 한글 글꼴 삽입 -- → matplotlib module에서 .. Failures & Issues/problem-solution 2022. 3. 27. Data Science Methodology (from Coursera) - From problem to approach - Q1. What is the problem that you are trying to solve? Q2. How can you use data to answer the question? - Working with the data - Q3. What data do you need to answer the question? Q4. Where is the data coming from (identify all sources) and how will you get it? Q5. Is the data that you collected representative of the problem to be solved? Q6. What additional work is r.. Computer Science/Basics 2022. 3. 27. [통합] 프로젝트 계획 수립하기 (통합관리 - 계획수립) 1. 서론 및 학습목표 → 통합관리 하고자 하는 IT 프로젝트 관리 대상 요소를 식별할 수 있다 → 통합관리를 위한 관리 체계를 정의하고, 관리를 위한 세부 프로세스를 정립할 수 있다 → 프로젝트 계획 수립을 위한 주요사항과 S/W 개발 방법론에 대해 이해할 수 있다 → 식별된 통합관리 대상 요소를 관리할 수 있는 계획을 수립할 수 있다 2. 프로젝트 통합 관리 개요 → 통합관리란? A. 프로젝트 진행의 다양한 프로세스를 파악하고 각각 정의, 정리하는 관리 활동을 말한다 - 즉, 단일화하고 결합하여 조정을 이루어가는 데 필요한 프로세스 및 활동 → 프로젝트에서 통합의 의미 - 요구사항 만족 - 기대치 관리 - 프로세스 체계적 단일화 - 프로젝트 관리를 효과적으로 표현하는 통합 - 자원 & 노력을 어느 곳.. IT knowledge/(etc) 2022. 3. 27. [기획] 사업 발주하기 1. 서론 및 학습목표 → [기획] 사업계획서 포스팅 [기획] 사업계획 수립하기 1. 서론 [1] 프로젝트 & 프로세스 → 프로젝트는 목표 달성, 즉 성공을 위하여 수행하는 고유한 프로세스의 집합으로 구성 → 여러 프로세스는 시작일 & 종료일이 정해져 있고, 각 프로세스에서 sh-avid-learner.tistory.com → [기획] 제안요청서 포스팅 [기획] 제안 요청서 작성하기 1. 서론 및 학습목표 → [기획] 사업 계획서 수립하기 [기획] 사업계획 수립하기 1. 서론 [1] 프로젝트 & 프로세스 → 프로젝트는 목표 달성, 즉 성공을 위하여 수행하는 고유한 프로세스의 집합으 sh-avid-learner.tistory.com → 학습목표 1️⃣ 입찰공고 전에 제안요청서를 사전 공개, 열람하도록 하여.. IT knowledge/(etc) 2022. 3. 26. Tools for Data Science (from Coursera) 1. Data Scientist's Toolkit [1] Languages of Data Science # Python → by far the most popular programming language for data science → it uses clear, readable syntax. You can do many of the things you are used to doing in other programming languages but with Python you can do it with less code. → a high-level general-purpose programming language that can be applied to many different classes of pro.. Computer Science/Basics 2022. 3. 26. 이전 1 ··· 22 23 24 25 26 27 28 다음