Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

資料結構

1.332 visualizaciones

Publicado el

《Python 3.5 技術手冊》第 9 章投影片

Publicado en: Software
  • Sé el primero en comentar

資料結構

  1. 1. 9.資料結構 • 學習目標 – 認識 hashable、iterable、 orderable – 對物件進行排序 – 認識群集架構 – 運用 collections 模組 – 運用 collections.abc 模組
  2. 2. hashable 協定 • 試圖在 set 中置放這些型態的實例,就會 引發 TypeError:
  3. 3. • 一個物件能被稱為 hashable,它必須有個 hash 值 • 這個值在整個執行時期都不會變化, 而且 必須可以進行相等比較 • 具體來說, 一個物件能被稱為 hashable, 必須實作 __hash__() 與 __eq__() 方法
  4. 4. • set 會對加入之物件,呼叫其 __hash__() 方法取得 hash 值 • 看它是否與目前 set 中既有物件的 hash 值都不相同 – 如果相同就會直接排除而不加入 – 若都不相同,則進一步使用 __eq__() 比較 相等性,以確定是否要加入 set 之中
  5. 5. • 對於 Python 內建型態來說,只要是建立後 – 狀態就無法變動(Immutable)的型態,它的 實例都是 hashable – 可變動(Muttable)的型態之實例,都是 unhashable
  6. 6. • 一個自定義的類別建立的實例,預設也是 hashable 的 – 其 __hash__() 實作,基本上是根據 id() 計 算而來 – 而 __eq__() 實作,預設是使用 is 來比較 – 因此,兩個分別建立的實例,hash 值必然不相 同,而且相等性比較一定不成立
  7. 7. • 什麼樣的狀態會被認定為重複,還是要自 行定義 __hash__() 與 __eq__():
  8. 8. • hashable 物件,建議狀態是不可變動 • 兩個物件若是相等性比較成立,那麼也必 須有相同的 hash 值 • 然而 hash 值相同,兩個物件的相等性比較 不一定是成立的
  9. 9. iterable 協定 • 具有 __iter__() 方法的物件,就是一個 iterable 物件 • 傳回的迭代器具有 __next__() 方法,可 以逐一迭代出物件中,的資訊,若無法進 一步迭代,會引發 StopIteration • 迭代器也會具有 __iter__() 方法,傳回 迭代器自身,因此,每個迭代器本身也是 個 iterable 物件
  10. 10. • 對於狀態比較複雜的物件來說,有時產生 器不見得適合時,就會親自實作 __iter__()等方法來建立迭代器
  11. 11. • 同樣的需求,也可以使用產生器來實作
  12. 12. • 標準程式庫有許多情況下,都接受iterable 物件,在內部自動呼叫 __iter__() • 若 lt 是[1, 2, 3, 4, 5]: –set(lt) 會建立 {1, 2, 3} –tuple(lt) 會建立 (1, 2, 3, 4, 5)
  13. 13. • 標準程式庫中提供了 itertools 模組,當 中許多函式,可協助建立迭代器或產生器
  14. 14. • accumulate() 可在迭代的過程中進行累 加或指定的運算: • chain() 或 chain.from_iterable() 可將指定的序列攤平逐一迭代:
  15. 15. • dropwhile()、takewhile()、 filterfalse()
  16. 16. • 有時候會需要依某個鍵來進行分類
  17. 17. • 使用 itertools 的 groupby() 函式可以 省事許多:
  18. 18. orderable 協定 • 如果打算對一個 list 進行排序,可以直接 呼叫它的 sort() 方法,這會在既有的 list 上進行排序:
  19. 19. • 也可以使用 key 參數,指定要使用哪個值 進行排序:
  20. 20. • list 才有 sort() 方法 • 對於其他 iterable 物件,若想進行排序的 話,可以使用 sorted() 函式,可指定的 參數同樣也有 reverse 與 key 參數 • 此函式不會變動原有的函式,排序的結果 會以新的 list 傳回
  21. 21. • 如果是自訂的類別實例,它們怎麼會知道 該怎麼排序呢?
  22. 22. • 如果希望自訂型態在 sorted() 或者是使 用 list 的 sort() 時,可以有預設的排 序定義,必須實作 __lt__() 方法:
  23. 23. • 可以指定 operator 模組的 itemgetter,、 attrgetter,前者可以針對具有索引的 結構,後者可以針對物件的屬性:
  24. 24. 認識群集架構 • 群集分為三種類型: – 循序類型(Sequences type) – 集合類型(Set type) – 映射類型(Mapping type)
  25. 25. • 循序類型都是有序、具備索引的資料結構, 循序類型都是 iterable 物件
  26. 26. • tuple、str 與 bytes 是不可變動的循序 類型,具有預設的 hash()實作 • 可變動循序結構,還會有以下的操作行為:
  27. 27. • 集合類型是無序,而且元素必須都是 hashable 物件而且不會重複,它們是 iterable 物件 • 可以使用 x in set、x not in set、 len(set),以及交集、聯集、差集與對稱 差集等操作 • set 本身是可變動的,如果想要不可變動 的集合類型,可以使用 frozenset() 來 建立
  28. 28. • 映射類型可以將 hashable 物件映射至一個 任意值 • Python 中的內建型態就是 dict
  29. 29. • 如果想實作先進後出的堆疊結構,可以使 用 list,運用 append() 與 pop() 方法
  30. 30. • 對於佇列或雙向佇列來說,使用 list 的效 率並不好 • 建議使用 collections 模組中提供的 deque 類別
  31. 31. • 有個 rotate()方法,可實作出環狀佇列
  32. 32. • 如果想要有個簡單類別,以便建立的實例 能擁有欄位名稱,實際上不用自行定義, 而可以使用 collections 模組的 namedtuple() 函式
  33. 33. • 如果來源是個 iterable 物件, 除了 Point(*iterable) 的方式之外,還可 以使用 Point._make(iterable) 建立 Point 實例
  34. 34. • 若想以一定的順序來走訪 dict 中鍵值
  35. 35. • 如果想要在建立 dict 時保有最初鍵值加入 的順序,可以使用 collections 模組的 OrderedDict
  36. 36. • 依鍵排序或依值排序的常見需求:
  37. 37. • 用 collections 的 defaultdict 類別 • defaultdict 接受一個函式,它建立的實 例在當指定的鍵不存在時,就會使用指定 的函式來產生,並直接設定為鍵的對應值
  38. 38. • 使用 defaultdict 來設計一個計數器
  39. 39. • collections 模組中就個 Counter 類別
  40. 40. • 可以指定一個 dict 給 Counter,它會依 dict 中值的指定,建立對應數量的鍵
  41. 41. • 有多個 dict 物件,想要將它們合併在一起
  42. 42. • 可以使用 collections 的 ChainMap 來 達到相同的目的
  43. 43. • 如果透過 ChainMap 指定更新某對鍵值, 會在底層中第一個找到鍵的 dict 中更新對 應的值 • 若底層全部的 dict 都找不到對應的鍵時, 就會直接在第一個 dict 新增鍵值
  44. 44. • ChainMap 底層維護的 list,可以透過 maps 屬性來取得
  45. 45. • new_child() 方法可以指定dict,這會 建立一個新的 ChainMap,當中來源 ChainMap 中的 dict 並包含指定的 dict • 如果想建立新 ChainMap,不包含來源 ChainMap 的第一個 dict,可以使用 parents 屬性
  46. 46. • 想要實現 [] 取值,可以實作 __getitem__() • 想要實現 [] 設值, 可以實作 __setitem__() • 若想透過del 與 [] 來刪除, 可以實作 __delitem__()
  47. 47. • collections.abc 模組中提供了許多實 作群集時的基礎類別 • 開發者繼承這些類別,可以避免遺忘了必 須實作的方法,也可以有一些基本的共用 實作
  48. 48. • 方才自行實作的 ChainMap,可以改繼承 MutableMapping,以更符合 dict 的物 件協定:
  49. 49. • Mapping 並不是 dict 的子類別,只是擁 有 dict 的行為 • Sequence 也不是 list 的子類別,只是 擁有 list 的行為 • Set 也不是 set 的子類別,只是擁有 set 的行為
  50. 50. • 只是想要基於 str、list、dict 等行為,增 加一些自定義方法,可以使用 collections 的 UserString、UserList、UserDict

×