Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

前言

在前面的篇章中,我們學習了迭代器,這是一個很好的工具,特別是當你需要處理大型資料集時。然而,在Python中構建自己的迭代器有點麻煩和耗時。你必須定義一個實現迭代器協議(__iter__()和__next__()方法)的新類。在這個類中,需要自己管理變數的內部狀態並更新它們。此外,當__next__()方法中沒有要返回的值時,需要丟擲StopIteration異常。

有沒有更好的實現方式呢?答案是肯定的!這就是Python的生成器(Generator)解決方案。下面就來盤盤它。

Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

各位朋友,記得點贊+轉發,分享給更多的Python愛好者。

何為生成器?

為了更高效的構建自己的迭代器,在Python中對此有一個優雅的解決方案,這是很值得高興的。Python所提供的生成器(Generator)是用來幫助我們輕鬆建立迭代器。Generator允許你宣告一個行為類似迭代器的函式,也就是說,它可以在for迴圈中使用。簡單言之,

生成器(Generator)就是個返回迭代器物件的函式

。因此,這也是建立迭代器的簡單方法。在建立迭代器時,你不需要考慮所需的所有工作(如迭代協議和內部狀等),因為Generator將處理所有這些工作。

接下來,我們更進一步,輕鬆學懂Python中生成器是如何工作的以及如何定義它們。

定義生成器

如前一節所述,生成器是Python中一種特殊型別的函式。此函式不返回單個值,而是返回一個迭代器物件。在生成器函式中,返回值使用yield語句而不是return語句。下面定義一個簡單的生成器函式,程式碼清單如下:

Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

程式碼清單片段-01

在上述清單中,我們定義一個生成器函式。該函式執行yield語句而不是return關鍵字。yield語句使這個函式成為生成器。當我們呼叫這個函式時,它將返回(產生)一個迭代器物件。我們再來看看生成器的呼叫:

Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

程式碼清單片段-02

呼叫生成器,通常就跟建立物件類似,呼叫生成器函式,並賦給變數。

執行程式輸出結果如下:

Yielding First Item

A

Yielding Second Item

B

Yielding Last Item

C

在應用生成器程式碼中,我們呼叫firstGenerator()函式,它是一個生成器,並返回一個迭代器物件。我們將這個迭代器命名為myIter。然後在這個迭代器物件上呼叫next()函式。在每次next()呼叫中,迭代器按各自的順序執行yield語句並返回一個項。

根據規則,此生成器函式不應該包含return關鍵字。因為如果它包含,那麼return語句將終止此函式,也就無從滿足迭代器的要求了。

現在,讓我們透過for迴圈的幫助來定義一個更具有實際意義的生成器。在本例中,我們將定義一個生成器,它將連續跟蹤生成從0開始的數字序列,直到給定的最大限制。

程式碼清單如下:

Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

程式碼清單片段-03

執行程式輸出結果類似如下:

0

1

2

3

在上述清單中,我們定義一個生成器函式,它生成從0到給定數字的整數。正如所見,yield語句在for迴圈中。請注意,n的值自動儲存在連續的next()呼叫中。

有一點

需要注意

,在定義生成器時,返回值必須是yield語句,並不是說生成器不能出現return語句。只是通常把返回非None值return語句放在生成器最後,為StopIteration 異常新增附加資訊,以便呼叫者處理。示例如下:

Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

程式碼清單片段-04

下面是未進行異常處理時執行程式輸出結果類似如下:

99

100

Traceback (most recent call last):

File “……”, line 11, in

print(next(g))

StopIteration: 不支援大於100的數字生成!

若對程式進行了異常捕捉處理(try-except),顯示結果更簡明,自己執行試試看。

生成器與普通函式

如果一個函式至少包含一個yield語句,那麼它就是生成器函式。如果需要,還可以包含其他yield或return語句。yield和return關鍵字都將從函式中返回一些東西。

return和yield關鍵字之間的差異對於生成器來說非常重要。return語句會完全終止函式,而yield語句會暫停函式,儲存它的所有狀態,然後在後續的呼叫中繼續執行。

我們呼叫生成器函式的方式和呼叫普通函式一樣。但在執行過程中,生成器在遇到yield關鍵字時暫停。它將迭代器流的當前值傳送到呼叫環境,並等待下一次呼叫。同時,它在內部儲存區域性變數及其狀態。

以下是生成器函式與普通函式不同的關鍵點:

ü Generator函式返回(生成)一個迭代器物件。你無需擔心顯式地建立此迭代器物件,yield關鍵字為你做了這個工作。

ü Generator函式必須包含至少一個yield語句。如果需要,它可能包括多個yield關鍵字。

ü Generator函式內部實現迭代器協議(iter()和next()方法)。

ü Generator函式自動儲存區域性變數及其狀態。

ü Generator函式在yield關鍵字處暫停執行,並將控制權傳遞給呼叫者。

ü Generator函式在迭代器流沒有返回值時自動引發StopIteration異常。

我們用一個簡單的例子來演示普通函式和生成器函式之間的區別。在這個例子中,我們要計算前n個正整數的和。為此,我們將定義一個函式,該函式給出前n個正數的列表。我們將以兩種方式實現這個函式,一個普通函式和一個生成器函式。

普通函式程式碼如下:

Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

程式碼清單片段-05

執行程式輸出結果類似如下:

49999995000000

Elapsed Time in seconds: 1。2067763805389404

在程式碼清單中,我們定義一個普通函式,它返回前n個正整數的列表。當我們呼叫這個函式時,它需要一段時間來完成執行,因為它建立的列表非常龐大。它還使用了大量記憶體來完成此任務。

現在讓我們為相同的操作定義一個生成器函式來實現,程式碼清單如下:

Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

程式碼清單片段-06

執行程式結果類似如下:

49999995000000

(生成器模式)Elapsed Time in seconds: 1。0013225078582764

正如在生成器清單中所見,生成器在更短的時間內完成相同的任務,並且使用更少的記憶體資源。因為生成器是一個一個地生成項,而不是返回完整的列表。

效能改進

的主要原因(當我們使用生成器時)是值的惰性生成。這種按需值生成的方式,會降低記憶體使用量。生成器的另一個優點是,你不需要等到所有元素都生成後才開始使用它們。

生成器表示式

有時候,我們需要簡單的生成器來執行程式碼中相對簡單的任務。這正是生成器表示式(Generator Expression)用武之地。可以使用生成器表示式輕鬆地動態建立簡單的生成器。

生成器表示式類似於Python中的lambda函式。但要記住,lambda是匿名函式,它允許我們動態地建立單行函式。就像lambda函式一樣,生成器表示式建立的是匿名生成器函式。

生成器表示式的語法看起來像一個列表推導式。不同之處在於,我們在生成器表示式中使用圓括號而不是方括號。請看示例:

Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

執行結果類似如下:

[1, 8, 27, 64, 125]

<generator object <genexpr> at 0x000001337F92BEB0>

在上述清單中,我們在生成器表示式的幫助下定義了一個簡單的生成器。下面是語法:

cubes_gen = (i**3 for i in nums)

。你可以在輸出中看到生成器物件。正如所已經知的,為了能夠在生成器中獲取項,我們要麼顯式呼叫next()方法,要麼使用for迴圈遍歷生成器。接下來就列印cubes_gen物件中的項:

Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

執行程式,遍歷出的元素項結果是否和列表推導式一樣。

我們再看一個例子。來定義一個生成器,將字串中的字母轉換為大寫字母。然後呼叫next()方法列印前兩個字母。程式碼示例如下:

Python程式設計:如何搞定生成器(Generator)及表示式?來盤它

執行輸出結果如下:

M

A

生成器好處

生成器是非常棒的工具,特別是當需要在相對有限的記憶體中處理大型資料時。以下是在Python中使用生成器的一些主要好處:

1)記憶體效率:

假設有一個返回結果非常大序列的普通函式。例如,一個包含數百萬項的列表。你必須等待這個函式完成所有的執行,並將整個列表返回給你。就時間和記憶體資源而言,這顯然是低效的。另一方面,如果你使用生成器函式,它將一個一個地返回項,你將有機會繼續執行下一行程式碼。而不需要等待函式執行列表中的所有項。因為生成器一次只給你一項。

2)延遲計算:

生成器提供了延遲(惰性)計算求值的功能。延遲計算是在真正需要值時計算值,而不是在例項化時計算值。假設你有一個大資料集要計算,延遲計算允許你在整個資料集仍在計算生成中可立即開始使用資料。因為如果使用生成器,則不需要整個資料集。

3)易實現和可讀性:

生成器非常容易實現,並且提供了好的程式碼可讀性。記住,如果你使用生成器,你不需要擔心__iter__()和__next__()方法。你所需要的只是函式中一個簡單的yield語句。

4)處理無限流:

當你需要表示無限的資料流時,生成器是非常棒的工具。例如,一個無限計數器。理論上,你不能在記憶體中儲存無限流的,因為你無法確定儲存無限流需要多少的記憶體大小。這是生成器真正發揮作用的地方,因為它一次只產生一項,它可以表示無限的資料流。它不需要將所有的資料流儲存在記憶體中。

本文小結

主要介紹了生成器相關知識,用於更好的自定義迭代器。內容包括何為生成器?如何自定義生成器以及和普通函式的關鍵區別?如何實現生成器表示式?並總結了生成器的有點。透過這篇文章,相信你能更輕鬆高效的掌握Python常規的生成器方方面面。

最後,點個贊,關注一下,轉發分享出去吧,讓更多的Python愛好者get到 ^_^