A) missingno를 import하면 됩니다!
→ missingno를 import 합니다
import missingno as msno
→ 시각화로 나타나기 위해 matplotlib를 준비.
%matplotlib inline
→ matrix method) NaN 분포를 알고 싶은 dataframe 이름을 인자로 넣습니다.
(matrix에 여러 인자를 넣어 graphical하게 다양한 형태로 표현 가능)
msno.matrix(df_name)
→ graph 해석) NaN이 없으면 검정색, 존재하면 하얀 선으로 표시됩니다.
(즉 하얀 공간이 많을수록 NaN이 많다고 보시면 되겠습니다.)
ex)
- NaN값이 하나도 없습니다. 검정색이 빽빽히 칠해진 직사각형들의 모임입니다. -
- Gender column에 유난히 흰색이 많이 띕니다. NaN값이 많이 존재한다는 뜻 -
→ NaN 정확한 갯수 확인을 위해서는 isnull().sum()을 확인.
'Failures & Issues > problem-solution' 카테고리의 다른 글
SettingWithCopyWarning 해결법? (0) | 2022.04.13 |
---|---|
(python) what are NaN, Null, NA, None ? (0) | 2022.04.04 |
Q. Matplotlib graph 한글깨짐현상 & (-) 부호 해결법 (IDE - Jupyter Notebook) (0) | 2022.03.27 |
댓글