對Series的理解也源於對其相關的代碼操作,本次僅貼一些代碼來加深理解以及記憶 ...
對Series的理解也源於對其相關的代碼操作,本次僅貼一些代碼來加深理解以及記憶
1 import pandas as pd 2 import numpy as np 3 s = pd.Series(np.random.randn(5),index=['a','b','c','d','e']) # index添加行索引 4 s 5 # 輸出 6 a 1.752127 7 b 0.127374 8 c 0.581114 9 d 0.466064 10 e -1.493042 11 dtype: float64 12 13 s.index 14 # 輸出 Index(['a', 'b', 'c', 'd', 'e'], dtype='object') 15 16 s = pd.Series(np.random.randn(5)) # 自動添加索引 17 s 18 # 輸出 19 0 0.209798 20 1 0.791759 21 2 -1.352022 22 3 0.164453 23 4 0.647989 24 dtype: float64 25 26 d = {'a':0.,'b':1.,'d':3} # Series通過字典形式創建表,字典中的鍵就被當成行索引 27 s = pd.Series(d, index=list('abcd')) # 沒有的索引賦值為NaN 28 s 29 # 輸出 30 31 Out[12]: 32 a 0.0 33 b 1.0 34 c NaN 35 d 3.0 36 dtype: float64 37 38 s = pd.Series(5,index=list('abcd')) # 每個索引對應的值相等 39 s 40 #輸出 41 a 5 42 b 5 43 c 5 44 d 5 45 dtype: int64 46 47 s = pd.Series(np.random.randn(5)) # 通過隨機數創建 48 s 49 #輸出 50 0 -0.014250 51 1 0.990860 52 2 1.785053 53 3 -2.155324 54 4 -0.815233 55 dtype: float64 56 57 s[0] # 可以通過單個索引值讀取對應的值 58 #輸出 -0.014250144041201129 59 60 s[:3] # 可以通過索引範圍讀取對應的範圍值 61 # 輸出 62 0 -0.014250 63 1 0.990860 64 2 1.785053 65 dtype: float64 66 67 s[[1,3,4]] # 任意讀取多個索引可以使用列表的形式 68 # 輸出 69 1 0.990860 70 3 -2.155324 71 4 -0.815233 72 dtype: float64 73 74 np.sin(s) # 可以用numpy函數對Series創建的表中的數據進行一系列操作 75 # 輸出 76 0 -0.014250 77 1 0.836498 78 2 0.977135 79 3 -0.833973 80 4 -0.727885 81 dtype: float64 82 83 s = pd.Series(np.random.randn(5),index=['a','b','c','d','e']) 84 s 85 #輸出 86 a 1.127395 87 b 0.229895 88 c 0.161001 89 d 0.362886 90 e 0.203692 91 dtype: float64 92 93 s['a'] # 索引也可以是字元字元串 94 # 輸出 1.1273946030373316 95 96 s['b']= 3 # 可以通過索引賦值操作改變表中的值 97 s 98 # 輸出 99 a 1.127395 100 b 3.000000 101 c 0.161001 102 d 0.362886 103 e 0.203692 104 dtype: float64 105 106 s['g'] = 100 # 如果表中沒有那個索引,通過索引的賦值將會自動添加到表的行尾 107 s 108 # 輸出 109 a 1.127395 110 b 3.000000 111 c 0.161001 112 d 0.362886 113 e 0.203692 114 g 100.000000 115 dtype: float64 116 117 print(s.get('f')) # 也可以使用get函數讀取索引對應的值,如果沒有就返回預設的None 118 # 輸出 None 119 120 print (s.get('f',0)) # 也可以加自定義值的返回值 121 # 輸出 0 122 123 s1 = pd.Series(np.random.randn(3),index=['a','c','e']) 124 s2 = pd.Series(np.random.randn(3),index=['a','d','e']) 125 print(f'{s1}\n\n{s2}') 126 # 輸出 127 a -0.036147 128 c -1.466236 129 e -0.649153 130 dtype: float64 131 132 a 1.460091 133 d -0.788388 134 e 0.175337 135 dtype: float64 136 137 s1 + s2 # 通過Series創建的表也可以按照行相同索引對應的值相加,如果兩表索引對應 138 # 不上就預設賦值NaN 139 # 輸出 140 a 1.423945 141 c NaN 142 d NaN 143 e -0.473816 144 dtype: float64