dropna()是 pandas 庫中的一個函數(shù),用于刪除 DataFrame 中的缺失值。在數(shù)據(jù)分析和數(shù)據(jù)清洗中,缺失值通常需要被處理。使用 可以將缺失值所在的行或列從 DataFrame 中刪除,以便進(jìn)行進(jìn)一步的數(shù)據(jù)分析。dropna()
下面是 函數(shù)的一些用法:dropna()
1. 刪除含有缺失值的行或列
刪除含有缺失值的行: 或df.dropna(axis=0)df.dropna()
刪除含有缺失值的列:df.dropna(axis=1)
其中, 表示按行刪除, 表示按列刪除。如果不指定 參數(shù),則默認(rèn)刪除含有缺失值的行。axis=0axis=1axis
2. 指定刪除的閾值
可以使用 參數(shù)來指定保留數(shù)據(jù)的最小非缺失值數(shù)量,若某一行或列中非缺失值數(shù)量小于該閾值,則該行或列將被刪除。thresh
按行刪除,保留至少 3 個非缺失值的行:df.dropna(thresh=3)
按列刪除,保留至少 2 個非缺失值的列:df.dropna(axis=1, thresh=2)
3. 指定刪除的位置
可以使用 參數(shù)來指定刪除缺失值的位置,以及要考慮的列。subset
刪除 “age” 列中缺失值的行:df.dropna(subset=['age'])
刪除 “age” 和 “gender” 列中缺失值的行:df.dropna(subset=['age', 'gender'])
4. 填充缺失值
除了刪除缺失值,還可以使用 函數(shù)來填充缺失值。函數(shù)可以用指定的值填充缺失值,例如:fillna()fillna()
使用 0 填充缺失值:df.fillna(0)
使用平均值填充缺失值:df.fillna(df.mean())
以上是 函數(shù)的一些常用用法,可以根據(jù)具體的需求選擇使用。