Pandas
1. 개념 * python library로 구조화된 데이터를 효과적으로 처리하고 저장한다 - array 계산에 특화된 NumPy를 기반으로 설계한다 - 2차원 데이터 외 대용량 데이터 처리에 효과적임 - 데이터 가공, 변환, 정제, 수집, 전처리, 통계, 시각화 작업 모두 가능 -1- 데이터 수집) 텍스트, CSV, Excel, HTML(BeautifulSoup), XML, Hdfs, db, JSON 여러 형태를 pandas는 읽을 수 있다 -2- 데이터 전처리) 전처리 과정을 반드시 거쳐야 함 - 분석가능한 형태로 변형 (null 처리, 이상치, 정규화 등등) -3- 데이터 분석) 통계 & 시각화(matplotlib, seaborn) -4- 예측) pandas에서는 지원하지 않음 - sklearn, T..
Python/Pandas&Numpy
2022. 3. 21.
list comprehension
Q. list comprehension? A. list 안에 for문(+if문)을 포함시켜 편리 & 직관적인 프로그래밍 짜기 [f(x) for x in nums] → filter condition 추가도 가능! (if문) [f(x) for x in nums if g(x)] → ex) list안에 있는 element들을 한 줄만으로(👍) element 제곱형태로 표현 가능! nums = [1,2,3,4] result = [x*x for x in nums] #result == [1,4,9,16] nums = [1,2,3,4] result = [x*x for x in nums if x%2 == 0] #result == [4,16] (+) Map + filter → ex) nums = [1,2,3,4] list..
Python/Fundamentals
2022. 3. 20.
python intro. (01)
1. python 활용을 위한 기초적인 재료 [1] print() - ,(콤마)를 이용해서 여러 자료를 출력할 수 있다. (, 사이 띄어쓰기) - print() 여러 번 사용: print() 사이 enter키의 사용으로 여러 줄에 걸쳐 출력이 일어난다 print("hello!") print(3, "hello!") + sep - print문 사이 출력할 여러 형태들을 (,로 구분) 그 사이사이 sep 구분자를 집어넣어 출력한다는 뜻 - 단, sep = \n일 경우 한 줄 띄워서 출력된다 (\t는 탭 기준 띄어서 출력) print(1,2,3, sep=',') #1,2,3 print(1920,1080, sep='X') #1920X1080 print(26, 35, 55, sep='\n') #26 #35 #55 ..
Python/Fundamentals
2022. 3. 18.