數據去重可以使用duplicated()和drop_duplicates()兩個方法。 DataFrame.duplicated(subset = None,keep =‘first’)返回boolean Series表示重覆行 參數: subset:列標簽或標簽序列,可選 僅考慮用於標識重覆項的某 ...
數據去重可以使用duplicated()和drop_duplicates()兩個方法。
DataFrame.duplicated(subset = None,keep =‘first’)返回boolean Series表示重覆行
參數:
subset:列標簽或標簽序列,可選
僅考慮用於標識重覆項的某些列,預設情況下使用所有列
keep:{‘first’,‘last’,False},預設’first’
first:標記重覆,True除了第一次出現。
last:標記重覆,True除了最後一次出現。
錯誤:將所有重覆項標記為True。