collection模塊: 在內置數據類型(dict、list、set、tuple)的基礎上,collections模塊還提供了幾個額外的數據類型:Counter、deque、defaultdict、namedtuple和OrderedDict等。 1:namedtuple 生成可以使用名字來訪問元 ...
collection模塊:
在內置數據類型(dict、list、set、tuple)的基礎上,collections模塊還提供了幾個額外的數據類型:Counter、deque、defaultdict、namedtuple和OrderedDict等。
1:namedtuple
生成可以使用名字來訪問元素內容的元組(tuple)
例如:表示一個坐標
from collections import namedtuple
point = namedtuple('point',['x','y'])
p=point(1,2)
print(p.x)
print(p.y)
>>1
>>2
2:deque雙端隊列:
雙端隊列,可以快速的從另外一側追加和推出對象。
使用list存儲數據時,按索引訪元素很快,但是插入和刪除元素就很慢了,因為list是線性存儲,數據量大的時候,插入和刪除效率很低
deque是為了高效實現插入和刪除操作的雙向列表,適合用於隊列和棧
from collections import deque
q=deque(['a','b','c'])
q.append('x')
q.appendleft('y')
print(q)
>>deque(['y', 'a', 'b', 'c', 'x'])
3:Counter計數器
計數器,主要用來計數
目的是用來跟蹤值出項的次數,它是一個無序的容器類型,以字典的鍵值對的形式存儲,其中元素作為key,其計數作為value
計數值可以是任意的interger(包括0和負數),
創建:
from collections import Counter
#創建一個空的類
c=Counter()
#從一個可迭代對象中創建
c=Counter('gallahad')
#從一個字典對象創建
c=Counter({'a':2,'b':4})
#從一組鍵值對創建
c=Counter(a=2,b=4)
計數值的訪問與缺失的鍵
當所訪問的鍵不存在時,返回0,而不是KeyError;否則返回它的計數
計數值的訪問
c=Counter('gallahad')
print(c['a'])
print(c['z'])
>>3
>>0
計數器的更新(update和subtract)
可以使用一個可迭代對象或者另一個Counter對象來更新鍵值對
update增加
c=Counter('gallahad')
c.update('chengzheng')
print(c['e'])
>>2
d=Counter('holloword')
c.update(d)
print(c['l'])
>>4
subtract減少
c=Counter('gallahad')
c.subtract('g')
print(c['g'])
>>0
d=Counter('all')
c.subtract(d)
print(c['l'])
>>0
鍵的修改和刪除
當計數值為0時,並不意味著元素被刪除,刪除元素應當使用del
c=Counter('gallahad')
print(c)
c['a']=0
print(c)
del c['l']
print(c)
>>Counter({'a': 3, 'l': 2, 'g': 1, 'h': 1, 'd': 1})
>>Counter({'l': 2, 'g': 1, 'h': 1, 'd': 1, 'a': 0})
>>Counter({'g': 1, 'h': 1, 'd': 1, 'a': 0})
elements():
返回一個迭代器。元素被重覆了多少次,在該迭代器中就包含多少個該元素。元素排列無確定順序,個數小於1的元素不被包含。
c =Counter(a=4,b=2,c=0,d=-2)
a =list(c.elements())
print(a)
>>['a', 'a', 'a', 'a', 'b', 'b']
most_common():
返回一個top (n)列表。如果n沒有被指定,則返回所有元素,當多個元素計數值相同時,排列是無序的
c =Counter('xsgffikgkhgdyrduykkf')
a =c.most_common(3)
print(a)
其他操作:
sum(c.values()) # 所有計數的總數
c.clear() # 重置Counter對象,註意不是刪除
list(c) # 將c中的鍵轉為列表
set(c) # 將c中的鍵轉為set
dict(c) # 將c中的鍵值對轉為字典
c.items() # 轉為(elem, cnt)格式的列表
Counter(dict(list_of_pairs)) # 從(elem, cnt)格式的列表轉換為Counter類對象
c.most_common()[:-n:-1] # 取出計數最少的n個元素
c += Counter() # 移除0和負值
4:OrderdDict有序字典
使用字典(dict),key是無序的,在對字典做迭代時,我們無法確定key的順序。
如果要key有順序,可以用OrderdDict
from collections import OrderedDict
d=dict([('a',1),('b',2),('c',3)])
print(d)
od=OrderedDict([('a',1),('b',2),('c',3)])
print(od)
>>{'c': 3, 'b': 2, 'a': 1}
>>OrderedDict([('a', 1), ('b', 2), ('c', 3)])
註意:OrderdDict是按照插入的順序來排序的,不是按照key本身來排序的。
od=OrderedDict([('a',1),('c',3),('b',2)])
print(od)
>>OrderedDict([('a', 1), ('c', 3), ('b', 2)])
5:defaultdict:帶有預設值的字典
例子:
有如下值集合 [11,22,33,44,55,66,77,88,99,90...],將所有大於 66 的值保存至字典的第一個key中,將小於 66 的值保存至第二個key的值中。
即: {'k1': 大於66 , 'k2': 小於66}
from collections import defaultdict
values = [11, 22, 33,44,55,66,77,88,99,90]
my_dict = defaultdict(list)
for value in values:
if value>66:
my_dict['k1'].append(value)
else:
my_dict['k2'].append(value)
print(my_dict)
>>defaultdict(<class 'list'>, {'k2': [11, 22, 33, 44, 55, 66], 'k1': [77, 88, 99, 90]})