Failures & Issues/problem-solution

Q) NaN - dataframe 분포 그림으로 확인할 방법?

metamong 2022. 3. 23.

A) missingno를 import하면 됩니다!

 

→ missingno를 import 합니다

 

import missingno as msno

 

→ 시각화로 나타나기 위해 matplotlib를 준비.

 

%matplotlib inline

 

→ matrix method) NaN 분포를 알고 싶은 dataframe 이름을 인자로 넣습니다.

(matrix에 여러 인자를 넣어 graphical하게 다양한 형태로 표현 가능)

 

msno.matrix(df_name)

 

→ graph 해석) NaN이 없으면 검정색, 존재하면 하얀 선으로 표시됩니다.

(즉 하얀 공간이 많을수록 NaN이 많다고 보시면 되겠습니다.)

 

ex) 

 

- NaN값이 하나도 없습니다. 검정색이 빽빽히 칠해진 직사각형들의 모임입니다. - 

 

 

- Gender column에 유난히 흰색이 많이 띕니다. NaN값이 많이 존재한다는 뜻 - 

 

 

→ NaN 정확한 갯수 확인을 위해서는 isnull().sum()을 확인.

댓글