[TOC] pandas可以進行數據輸入和輸出,有以下幾種類型:讀取文本文件及硬碟上其他更高效的格式文件,從資料庫中載入數據,於網路資源進行交互(比如Web API)。 下麵進行不同文本文件的讀取和寫入操作講解,首先進行文本格式數據的讀寫講解。 一:文本格式數據的讀寫 將表格型數據讀取為DataFr ...
目錄
pandas可以進行數據輸入和輸出,有以下幾種類型:讀取文本文件及硬碟上其他更高效的格式文件,從資料庫中載入數據,於網路資源進行交互(比如Web API)。
下麵進行不同文本文件的讀取和寫入操作講解,首先進行文本格式數據的讀寫講解。
一:文本格式數據的讀寫
將表格型數據讀取為DataFrame對象是pandas的重要特性。下麵介紹一下一些方法。
pd.read_csv():將csv文件數據讀入一個DataFrame。
pd.read_table():將csv文件數據讀入一個DataFrame,可以用sep指定分隔符,一般為",",可以針對不同的分隔符號用正則表達式分隔。
有時候文件並不包含表頭行,就需要選擇一些選項,用header=None可以自動分配預設列名,或者可以自己用names指定列名。
如果想要指定某一列作為索引,可以直接指定,或者將該列的列名傳給參數index_col。 在index_col裡面可以用列表作為參數,形成一個分層索引。
使用skiprows可以跳過某些行,且使用isnull可以檢測數組中的缺失值。
使用na_values選項可以傳入一個列表或一組字元串來處理缺失值。或者用字典指定列的缺失值標識。