Python/Pandas&Numpy

pandas Tricks (Kevin by DataSchool) 완료! COMPILATION

metamong 2022. 4. 18.

길고 긴 Keving Pandas Tricks를 모두 끝냈다 😍 (총 14개의 trick 포스팅!)

 

pandas라는 강력한, 극강의 library를 통해 dataframe을 자유자재로 이용할 수 있게 되었다.

 

추가로 더 알게되는 유용한 기능들이 있다면 계속해서 pandas tricks라는 이름 하에 올릴 예정🙋🏼‍♂️

 

https://www.youtube.com/watch?v=RlIiVeig3hc 

 

《pandas tricks compilation》

 

🏄🏼‍♂️ 행과 열 순서 바꾸기

 

pandas Tricks_01 👉🏻 'Reverse (row/column) Order' (Kevin by DataSchool)

Q) 데이터프레임이 주어졌다. 근데 내가 원하는 데이터는 행 기준 아래 부분. 데이터 용량이 워낙 커서 데이터 훑기도 힘들다면 A) '행과 열 순서 바꾸기' 👉🏻 .loc[::-1] & .loc[:,::-1] 사용하기 (

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ 원하는 데이터 타입을 가진 column만 뽑아내기

 

pandas Tricks_02 👉🏻 'Select columns by Data Type' (Kevin by DataSchool)

Q. 오늘도 데이터프레임이 주어졌다. 근데 특정 데이터 타입을 갖는 칼럼만 뽑아내고 싶다.. 어떻게 하면 될까...? A) 👉🏻 'select_dtypes' method 사용! 1> seaborn 'titanic' dataset 불러오면 (seaborn.load_..

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ 데이터 수치형으로 바꾸기

 

pandas Tricks_03 👉🏻 'Convert Strings→numbers ' (Kevin by DataSchool)

Q. 숱하게 많이 보이는 string형 data type...! 하지만 우리는 계산을 위해서 무조건 수치형으로 바꿔야 한다.. 하지만 너무 많은 방법들이 있다. 어떤게 제일 효과적이고 좋은 방법일까? 이 포스팅으

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ 여러 개의 file을 dataframe으로 한 번에

 

pandas Tricks_04 👉🏻 'Build a DataFrame from multiple files (row-wise & column-wise) ' (Kevin by DataSchool)

Q. 여러 csv파일을 가져와 한 개의 dataframe에 나타내고 싶으면? A) 👇 glob package의 glob module 사용! from glob import glob ♣ glob docu 👇👇 ♣ https://docs.python.org/3/library/glob.html ▧ gl..

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ clipboard를 dataframe으로? & dataframe 쪼개기

 

pandas Tricks_05 & 06👉🏻 'Create a DataFrame from the clipboard & Split a DataFrame into 2 random subsets' (Kevin by DataS

Q05) 빨리 한 dataframe을 만들고 싶을 때, 특히 연속하는 숫자, 문자 등 여러 일련의 data를 복붙해서 df로 만들고 싶다면? A) 👇 read_clipboard() 사용! pd.read_clipboard() ◈ read_clipboard docu ◈ h..

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ 고급 filtering 기능

 

pandas Tricks_07👉🏻 'Filtering - isin & tilde(~)&nlargest' (Kevin by DataSchool)

Q. dataframe 자체 내에 연산자를 써서 condition으로 data를 나눌 수 있다. 이 때 isin method & tilde를 써서 좀 더 깔끔하게! filtering 가능 A. condition에 isin method 사용, 그리고 tilde(~)를 condition..

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ 결측치 처리

 

pandas Tricks_08👉🏻 'missing values - dropna() & isna() (advanced)' (Kevin by DataSchool)

* handling missing values는 preprocessing 단계의 일부로 하단 포스팅에서 일부 배웠다 ↓↓↓↓ - dropna, isnull, fillna - Data Preprocessing * concepts🤲 ⊙ Although EDA and Data Preprocessing are t..

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ 자유자재로 넓히기

 

pandas Tricks_09&10👉🏻 'EXPANDING → a string & a series of lists - into a DF' (Kevin by DataSchool)

😌 dataframe내의 data를 자유자재로 나누어 갖다 붙이고, 들어 있는 게 list면 따로 뽑아내서 갖다 붙이고 싶다면..? → 즉, dataframe 자체를 자유자재로 추가 정보를 붙여 확대하고 싶을 때 사용! ← 1.

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ 자유자재로 reshaping

 

pandas Tricks_11👉🏻 'Reshaping → stack() & unstack()' (Kevin by DataSchool)

Q. 데이터를 재구조화하는 방법? A. stack() & unstack() 사용! 🙂 ¶ stack() docu https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.stack.html DataFrame.stack(level=- 1, dropna=True) 'Stac..

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ pivot table로 변신

 

pandas Tricks_12👉🏻 'pivot_table()' (Kevin by DataSchool)

👆 tidy data 포스팅에서 우리는 tidy한 data를 만들기 위해 기존 dataframe을 melt한다고 하였고, 다시 원위치 시키기 위해 pivot_table()을 활용한다고 배웠다. Tidy Data * 실제 사용되는 데이터는 하나의 완

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ display

 

pandas Tricks_13👉🏻 'change display options' (Kevin by DataSchool)

🕺 pandas & dataframe은 뗄레야 뗄 수 없는 관계! 🕺 ≪주어진 dataframe이 육안상 어떻게 보이게 하는 지 여러 설정을 통해 바꿔보자≫ ※ 여기서 중요한건, data는 internally하게 바뀌지 않는다는 점 (육

sh-avid-learner.tistory.com

 

🏄🏼‍♂️ dataframe 멋지게 꾸미기

 

pandas Tricks_14👉🏻 'styling a dataframe' (Kevin by DataSchool)

🤳 저번 pandas tricks 시간에는 display 형태를 어떻게 보이게 할 것인지에 대해 배웠었다. 좀 더 flexible한 강력한 dataframe styling에 대해 알아보려 한다! → pandas에는 이미 주어진 dataframe 또는 series..

sh-avid-learner.tistory.com

 

* 썸넬) https://m.facebook.com/DataScienceSchool/reviews/

댓글