上個一篇博客講解瞭如何進行數據的缺失值處理,本篇就來講解一下如何進行數據轉換的一系列操作。 一:刪除重覆值 由於各種原因,DataFrame中會出現重覆行,如下: 用duplicated方法可以返回一個布爾值Series,找出每一行是否有重覆情況。 而drop_duplicates返回的是DataF ...
上個一篇博客講解瞭如何進行數據的缺失值處理,本篇就來講解一下如何進行數據轉換的一系列操作。
一:刪除重覆值
由於各種原因,DataFrame中會出現重覆行,如下:
用duplicated方法可以返回一個布爾值Series,找出每一行是否有重覆情況。
而drop_duplicates返回的是DataFrame,內容是duplicated返回數組中為False的部分。
上面的方法預設是對列進行操作,可以在drop_duplicates方法的括弧裡邊加入參數指定需要去除重覆的列,加入參數keep = 'last'將會返回最後一個觀測到的值,如下:
二:使用函數或映射進行數據轉換
可以用map函數把一個函數或者包含映射關係的字典型對象加入到我們的數據列表中,如下:
三:替代值
可以用replace方法替換一些值,生成新的對象,也可以用字典的形式。