【Python】筆記:序列的修改、散列和切片

来源:https://www.cnblogs.com/Zinc233/archive/2022/12/03/FluentPython_S10.html
-Advertisement-
Play Games

序列的修改、散列和切片 from array import array import reprlib, math, numbers from functools import reduce from operator import xor from itertools import chain # ...


序列的修改、散列和切片

from array import array
import reprlib, math, numbers
from functools import reduce
from operator import xor
from itertools import chain
# Vector_v1
class Vector:
    typecode = 'd'

    def __init__(self, components) -> None:
        self._componeents = array(self.typecode, components)

    def __iter__(self):
        return iter(self._componeents)

    def __repr__(self):
        components = reprlib.repr(self._componeents)  # array('d', [1, 2, 3, 4, ...])
        components = components[components.find('['):-1]  # [1, 2, 3, 4, ...]
        return 'Vector({})'.format(components)  # Vector([1, 2, 3, 4])
    
    def __str__(self):
        return str(tuple(self))
    
    def __bytes__(self):
        return (bytes([ord(self.typecode)]) + bytes(self._componeents))

    def __eq__(self, other):
        return tuple(self) == tuple(other)

    def __abs__(self):
        return math.sqrt(sum(x * x for x in self))

    def __bool__(self):
        return bool(abs(self))
    
    def __len__(self):
        return len(self._componeents)
    
    def __getitem__(self, index):
        return self._componeents[index]

    @classmethod
    def frombytes(cls, octets):
        typecode = chr(octets[0])
        memv = memoryview(octets[1:]).cast(typecode)
        return cls(memv)

reprlib.repr() 獲取對象的有限長度表現形式, 多的用 ... 表示, eg. array('d', [0, 1, 2, 3, 4, ...])

# Test
v1 = Vector([3, 4, 5])

print(len(v1))
print(v1[0], v1[-1])

v7 = Vector(range(7))
print(v7[1:4])
3
3.0 5.0
array('d', [1.0, 2.0, 3.0])

切片原理

class Seq:
    def __getitem__(self, index):
        return index

s = Seq()
print(1, s[1])
print(2, s[1:4])
print(3, s[1:4:2])
print(4, s[1:4:2, 9])
print(5, s[1:4:2, 7:9])
1 1
2 slice(1, 4, None)
3 slice(1, 4, 2)
4 (slice(1, 4, 2), 9)
5 (slice(1, 4, 2), slice(7, 9, None))
print(slice)
print(dir(slice))
print(help(slice.indices))
<class 'slice'>
['__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'indices', 'start', 'step', 'stop']
Help on method_descriptor:

indices(...)
    S.indices(len) -> (start, stop, stride)
    
    Assuming a sequence of length len, calculate the start and stop
    indices, and the stride length of the extended slice described by
    S. Out of bounds indices are clipped in a manner consistent with the
    handling of normal slices.

None

S.indices(len) -> (start, stop, stride)

自動將 slice 適配到 長度為 len 的對象上

print(slice(None, 10, 2).indices(5))
print(slice(-3, None, None).indices(5))
(0, 5, 2)
(2, 5, 1)
print('ABCDE'[:10:2])  # 等價於
print('ABCDE'[0:5:2])

print('ABCDE'[-3:])  # 等價於
print('ABCDE'[2:5:1])
ACE
ACE
CDE
CDE
# Vector_v2
class Vector:
    typecode = 'd'

    def __init__(self, components) -> None:
        self._componeents = array(self.typecode, components)

    def __iter__(self):
        return iter(self._componeents)

    ################################# NEW ######################################
    def __getitem__(self, index):
        cls = type(self)
        if isinstance(index, slice):  # slice 切片
            return cls(self._componeents[index])
        elif isinstance(index, numbers.Integral):  # int 索引
            return self._componeents[index]
        else:  # 拋出異常
            msg = '{cls.__name__} indices must be integers'
            raise TypeError(msg.format(cls=cls))

    def __repr__(self):
        components = reprlib.repr(self._componeents)  # array('d', [1, 2, 3, 4, ...])
        components = components[components.find('['):-1]  # [1, 2, 3, 4, ...]
        return 'Vector({})'.format(components)  # Vector([1, 2, 3, 4])
    
    def __str__(self):
        return str(tuple(self))
    
    def __bytes__(self):
        return (bytes([ord(self.typecode)]) + bytes(self._componeents))

    def __eq__(self, other):
        return tuple(self) == tuple(other)

    def __abs__(self):
        return math.sqrt(sum(x * x for x in self))

    def __bool__(self):
        return bool(abs(self))
    
    def __len__(self):
        return len(self._componeents)

    @classmethod
    def frombytes(cls, octets):
        typecode = chr(octets[0])
        memv = memoryview(octets[1:]).cast(typecode)
        return cls(memv) 
v7 = Vector(range(7))
print(1, v7[-1])
print(2, v7[1:4])
print(3, v7[-1:])
print(4, v7[1, 2])  # 報誤,不支持多維切片
1 6.0
2 (1.0, 2.0, 3.0)
3 (6.0,)



---------------------------------------------------------------------------

TypeError                                 Traceback (most recent call last)

Cell In [28], line 5
      3 print(2, v7[1:4])
      4 print(3, v7[-1:])
----> 5 print(4, v7[1, 2])


Cell In [22], line 19, in Vector.__getitem__(self, index)
     17 else:  # 拋出異常
     18     msg = '{cls.__name__} indices must be integers'
---> 19     raise TypeError(msg.format(cls=cls))


TypeError: Vector indices must be integers
# Vector_v3 動態存取屬性

class Vector:
    typecode = 'd'
    shortcut_numes = 'xyzt'

    def __init__(self, components) -> None:
        self._componeents = array(self.typecode, components)

    def __iter__(self):
        return iter(self._componeents)
    
    def __getitem__(self, index):
        cls = type(self)
        if isinstance(index, slice):  # slice 切片
            return cls(self._componeents[index])
        elif isinstance(index, numbers.Integral):  # int 索引
            return self._componeents[index]
        else:  # 拋出異常
            msg = '{cls.__name__} indices must be integers'
            raise TypeError(msg.format(cls=cls))

    ################################# NEW ######################################
    def __getattr__(self, name):
        cls = type(self)
        if len(name) == 1:
            pos = cls.shortcut_numes.find(name)
            if 0 <= pos < len(self._componeents):
                return self._componeents[pos]
        
        msg = '{.__name__!r} object has no attribute {!r}'
        raise AttributeError(msg.format(cls, name))
v5 = Vector(range(5))
print(1, v5)
print(2, v5.x)

v5.x = 10
print(3, v5.x)  # v5[0] 變了?

print(4, v5)  # v5 實際上並沒有變
1 (0.0, 1.0, 2.0, 3.0, 4.0)
2 0.0
3 10
4 (0.0, 1.0, 2.0, 3.0, 4.0)

解釋:

  • 當且僅當對象中沒有 指定名稱 的屬性時, 才會調用 __getattr__
  • 當執行 v5.x = 10 會給 v5 創建 x 這個屬性, 這個屬性也稱為 虛擬屬性
  • 之後訪問 v5.x 便是該屬性的值, 而不通過 __getattr__ 獲取
# 改進

# Vector_v3 動態存取屬性

class Vector:
    typecode = 'd'
    shortcut_numes = 'xyzt'

    def __init__(self, components) -> None:
        self._componeents = array(self.typecode, components)

    def __getattr__(self, name):
        cls = type(self)
        if len(name) == 1:
            pos = cls.shortcut_numes.find(name)
            if 0 <= pos < len(self._componeents):
                return self._componeents[pos]
        
        msg = '{.__name__!r} object has no attribute {!r}'
        raise AttributeError(msg.format(cls, name))

    ################################# NEW ######################################
    def __setattr__(self, name, value) -> None:
        cls = type(self)
        if len(name) == 1:
            if name in cls.shortcut_numes:
                error = 'readonly attribute {attr_name!r}'
            elif name.islower():
                error = "can't set attributes 'a' to 'z' in {cls_name!r}"
            else:
                error = ''

            if error:
                msg = error.format(cls_name=cls.__name__, attr_name=name)
                raise AttributeError(msg)
        super().__setattr__(name, value)  

通過 __setattr__ 方法防止其修改部分屬性

v6 = Vector(range(6))
print(1, v6)
print(2, v6.x)

v6.x = 10
1 <__main__.Vector object at 0x000001BD0AD009A0>
2 0.0



---------------------------------------------------------------------------

AttributeError                            Traceback (most recent call last)

Cell In [35], line 5
      2 print(1, v6)
      3 print(2, v6.x)
----> 5 v6.x = 10


Cell In [34], line 35, in Vector.__setattr__(self, name, value)
     33     if error:
     34         msg = error.format(cls_name=cls.__name__, attr_name=name)
---> 35         raise AttributeError(msg)
     36 super().__setattr__(name, value)


AttributeError: readonly attribute 'x'

散列 & 快速等值測試

__hash__

需要依次計算 v[0] ^ v[1] ^ v[2] ...

reduce()

__eq__

# 複習一下 reduce
print(reduce(lambda a, b: a * b, range(1, 6)))
120
# 計算多個數異或與
print(reduce(lambda a, b: a ^ b, range(233)))
print(reduce(xor, range(233)))

n = 0
for i in range(1, 233):
    n ^= i
print(n)
232
232
232
# Vector_v3 加入 __hash__

class Vector:
    typecode = 'd'

    def __init__(self, components) -> None:
        self._componeents = array(self.typecode, components)

    def __iter__(self):
        return iter(self._componeents)

    ################################# OLD ######################################
    def __eq__(self, other):
        return tuple(self) == tuple(other)

    ################################# NEW ######################################
    def __hash__(self):
        hashes = (hash(x) for x in self._componeents)
        return reduce(xor, hashes, 0)
    

註:

  • 使用 reduce() 最好提供三個參數 reduce(function, iterable, initializer)
  • 通常, 對於 +, |, ^ initializer = 0
  • 通常, 對於 *, & initializer = 1

__eq__ 要和 __hash__ 在一起哦~

# 使用【映射歸約】實現 __hash__ (map, reduce)
# Vector_v3 加入 __hash__

class Vector:
    typecode = 'd'

    def __init__(self, components) -> None:
        self._componeents = array(self.typecode, components)

    def __iter__(self):
        return iter(self._componeents)

    ################################# NEW ######################################
    def __hash__(self):
        hashes = map(hash, self._componeents)  # 計算各個元素的hash
        return reduce(xor, hashes, 0)

    ################################# NEW ######################################
    def __eq__(self, other):
        if len(self) != len(other):  # 長度不相等, 直接 False
            return False

        for a, b in zip(self, other):  # 判斷每個對應元素是否相等
            if a != b:
                return False

        return True

    ################################# NEW ######################################
    # 另一種方法
    def __eq__(self, other):
        return len(self) != len(other) and all(a == b for a, b in zip(self, other))

all() 只要有一個是 False , 整個都是 False

上面兩種 __eq__ 效果相等

# 回憶一下 zip()

print(1, zip(range(3), 'ABC'))
print(2, list(zip(range(3), 'ABC')))

print(3, list(zip(range(3), 'ABC', [0, 1, 2, 3])))  # 什麼???一個可迭代對象迭代完了, 就不迭代了

from itertools import zip_longest
print(4, list(zip_longest(range(3), 'ABC', [0, 1, 2, 3], fillvalue=1)))  # 按照最長的iter迭代, 空的用 fillvalue 補齊
1 <zip object at 0x000001BD0A82A9C0>
2 [(0, 'A'), (1, 'B'), (2, 'C')]
3 [(0, 'A', 0), (1, 'B', 1), (2, 'C', 2)]
4 [(0, 'A', 0), (1, 'B', 1), (2, 'C', 2), (1, 1, 3)]

zip_longest() 按照最長的 iter 迭代, 空的用 fillvalue 補齊

format 格式化

目標: 得到球面坐標 <r, ɸ1, ɸ2, ɸ3>

# 使用【映射歸約】實現 __hash__ (map, reduce)
# Vector_v3 加入 __hash__

class Vector:
    typecode = 'd'

    def __init__(self, components) -> None:
        self._componeents = array(self.typecode, components)

    def __iter__(self):
        return iter(self._componeents)

    ################################# NEW ######################################
    def angle(self, n):
        r = math.sqrt(sum(x * x for x in self[n:]))
        a = math.atan2(r, self[n-1])
        if (n == len(self) - 1) and (self[-1] < 0):
            return math.pi * 2 - a
        else:
            return a

    def angles(self):
        return (self.angle(n) for n in range(1, len(self)))

    def __format__(self, fmt_spec=''):
        if fmt_spec.endswith('h'):  # 獲取超球體坐標
            fmt_spec = fmt_spec[:-1]
            coords = chain([abs(self)], self.angles())  # 生成生成器表達式, 無縫迭代向量的模和各個角坐標
            outer_fmt = '<{}>'
        else:
            coords = self
            outer_fmt = '({})'
        
        components = (format(c, fmt_spec) for c in coords)
        return outer_fmt.format(', '.join(components))
# Vector Final

class Vector:
    typecode = 'd'

    def __init__(self, components) -> None:
        self._componeents = array(self.typecode, components)

    def __iter__(self):
        return iter(self._componeents)

    def __getitem__(self, index):
        cls = type(self)
        if isinstance(index, slice):  # slice 切片
            return cls(self._componeents[index])
        elif isinstance(index, numbers.Integral):  # int 索引
            return self._componeents[index]
        else:  # 拋出異常
            msg = '{cls.__name__} indices must be integers'
            raise TypeError(msg.format(cls=cls))

    def __repr__(self):
        components = reprlib.repr(self._componeents)  # array('d', [1, 2, 3, 4, ...])
        components = components[components.find('['):-1]  # [1, 2, 3, 4, ...]
        return 'Vector({})'.format(components)  # Vector([1, 2, 3, 4])
    
    def __str__(self):
        return str(tuple(self))
    
    def __bytes__(self):
        return (bytes([ord(self.typecode)]) + bytes(self._componeents))
    
    def __hash__(self):
        hashes = map(hash, self._componeents)  # 計算各個元素的hash
        return reduce(xor, hashes, 0)

    def __eq__(self, other):
        return len(self) != len(other) and all(a == b for a, b in zip(self, other))

    def __abs__(self):
        return math.sqrt(sum(x * x for x in self))

    def __bool__(self):
        return bool(abs(self))
    
    def __len__(self):
        return len(self._componeents)

    shortcut_numes = 'xyzt'

    def __getattr__(self, name):
        cls = type(self)
        if len(name) == 1:
            pos = cls.shortcut_numes.find(name)
            if 0 <= pos < len(self._componeents):
                return self._componeents[pos]
        
        msg = '{.__name__!r} object has no attribute {!r}'
        raise AttributeError(msg.format(cls, name))

    def __setattr__(self, name, value) -> None:
        cls = type(self)
        if len(name) == 1:
            if name in cls.shortcut_numes:
                error = 'readonly attribute {attr_name!r}'
            elif name.islower():
                error = "can't set attributes 'a' to 'z' in {cls_name!r}"
            else:
                error = ''

            if error:
                msg = error.format(cls_name=cls.__name__, attr_name=name)
                raise AttributeError(msg)
        super().__setattr__(name, value)

    @classmethod
    def frombytes(cls, octets):
        typecode = chr(octets[0])
        memv = memoryview(octets[1:]).cast(typecode)
        return cls(memv)

本文來自博客園,作者:Zinc233,轉載請註明原文鏈接:https://www.cnblogs.com/Zinc233/p/FluentPython_S10.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • S11 介面:從協議到抽象基類 # random.shuffle 就地打亂 from random import shuffle l = list(range(10)) shuffle(l) print(l) shuffle(l) print(l) [0, 6, 3, 2, 4, 8, 5, 7, ...
  • 好家伙, xdm,密碼驗證忘寫了,哈哈 bug展示: 1.登陸沒有密碼驗證 主要體現為,亂輸也能登進去 (小問題) 要是這麼上線估計直接寄了 分析一波密碼校驗怎麼做: 前端輸完用戶名密碼之後,將數據發送到後端處理 後端要做以下幾件事 ①先確認這個用戶名已註冊 ②我們拿著這個用戶名去資料庫中找對應的數 ...
  • 說明: 本文基於Spring-Framework 5.1.x版本講解 概述 說起生命周期, 很多開源框架、中間件的組件都有這個詞,其實就是指組件從創建到銷毀的過程。 那這裡講Spring Bean的生命周期,並不是講Bean是如何創建的, 而是想講下Bean從實例化到銷毀,Spring框架在Bean ...
  • 1、Durid 1.1 簡介 Java程式很大一部分要操作資料庫,為了提高性能操作資料庫的時候,又不得不使用資料庫連接池。 Druid 是阿裡巴巴開源平臺上一個資料庫連接池實現,結合了 C3P0、DBCP 等 DB 池的優點,同時加入了日誌監控。 Druid 可以很好的監控 DB 池連接和 SQL ...
  • 1、參考文獻說明 參考博客:https://www.cnblogs.com/dy12138/articles/16799941.html Vmware Workstation pro 17 安裝會比較簡單,基本上點下一步就行了。 新功能介紹和破解碼請見:https://www.ghxi.com/vm ...
  • 鎖概述 在電腦科學中,鎖是在執行多線程時用於強行限制資源訪問的同步機制,即用於在併發控制中保證對互斥要求的滿足。 鎖相關概念 鎖開銷:完成一個鎖可能額外耗費的資源,比如一個周期所需要的時間,記憶體空間。 鎖競爭:一個線程或進程,要獲取另一個線程或進程所持有的鎖,邊會發生鎖競爭。鎖粒度越小,競爭的可能 ...
  • 原文鏈接: JWT詳解:https://blog.csdn.net/weixin_45070175/article/details/118559272 1、什麼是JWT 通俗地說,JWT的本質就是一個字元串,它是將用戶信息保存到一個Json字元串中,然後進行編碼後得到一個JWT token,並且這個 ...
  • Hello,大家好,我是阿粉,對接文檔是每個開發人員不可避免都要寫的,友好的文檔可以大大的提升工作效率。 阿粉最近將項目的文檔基於 Gitbook 和 Gitlab 的 Webhook 功能的在內網部署了一套實時的,使用起來特方便了。跟著阿粉的步驟,教你部署自己的文檔服務。 步驟 安裝 Node 和 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...