資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

来源:https://www.cnblogs.com/Python1234/archive/2018/05/26/9093555.html
-Advertisement-
Play Games

目錄 1. 什麼是正則化? 2. 正則化如何減少過擬合? 3. 深度學習中的各種正則化技術: L2和L1正則化 Dropout 數據增強(Data augmentation) 提前停止(Early stopping) 4. 案例:在MNIST數據集上使用Keras的案例研究 1. 什麼是正則化? 在 ...


目錄

1. 什麼是正則化?

2. 正則化如何減少過擬合?

3. 深度學習中的各種正則化技術:

L2和L1正則化

Dropout

數據增強(Data augmentation)

提前停止(Early stopping)

4. 案例:在MNIST數據集上使用Keras的案例研究

1. 什麼是正則化?

在深入該主題之前,先來看看這幾幅圖:

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

之前見過這幅圖嗎?從左到右看,我們的模型從訓練集的噪音數據中學習了過多的細節,最終導致模型在未知數據上的性能不好。

換句話說,從左向右,模型的複雜度在增加以至於訓練誤差減少,然而測試誤差未必減少。如下圖所示:

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

2. 正則化如何減少過擬合?

我們來看一個在訓練數據上過擬合的神經網路,如下圖所示:

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

如果你曾經學習過機器學習中的正則化,你會有一個概念,即正則化懲罰了繫數。在深度學習中,它實際上懲罰了節點的權重矩陣。

假設我們的正則化繫數很高,以至於某些權重矩陣近乎於0:

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

這會得到一個簡單的線性網路,而且在訓練數據集上輕微的欠擬合。

如此大的正則化繫數並不是那麼有用。我們需要對其進行優化從而得到一個擬合良好的模型,正如下圖所示:

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

這裡,lambda是正則參數。它是一個超參數用來優化得到更好的結果。L2正則化也叫權重衰減(weight decay ) ,因 為 它 強 制 權 重朝著 0 衰減(但不會 為 0)

在L1中,我 們 有:

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

dropout做什麼呢?每次迭代,隨機選擇一些節點,將它們連同相應的輸入和輸出一起刪掉,如下圖:

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

所以,每一輪迭代都有不同的節點集合,這也導致了不同的輸出。它也可以被認為是一種機器學習中的集成技術(ensemble technique)。

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

Patience表示在該數量的epochs內沒有進一步的性能改進後,就停止訓練。為了更好地理解,我們再看看上面的圖。在虛線之後,每個epoch都會導致一個更高的驗證集錯誤。因此,在虛線之後的5個epoch(因為我們設置patience等於5),由於沒有進一步的改善,模型將停止訓練。

註意:可能在5個epoch之後(這是一般情況下為patience設定的值)模型再次開始改進,並且驗證集錯誤也開始減少。因此,在調整這個超參數的時候要格外小心。

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

現在,載入數據。

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

現在拿一些圖片來看看。

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

# import keras modulesfrom keras.models import Sequentialfrom keras.layers import Dense# define varsinput_num_units = 784hidden1_num_units = 500hidden2_num_units = 500hidden3_num_units = 500hidden4_num_units = 500hidden5_num_units = 500output_num_units = 10epochs = 10batch_size = 128model = Sequential([Dense(output_dim=hidden1_num_units, input_dim=input_num_units, activation='relu'),Dense(output_dim=hidden2_num_units, input_dim=hidden1_num_units, activation='relu'),Dense(output_dim=hidden3_num_units, input_dim=hidden2_num_units, activation='relu'),Dense(output_dim=hidden4_num_units, input_dim=hidden3_num_units, activation='relu'),Dense(output_dim=hidden5_num_units, input_dim=hidden4_num_units, activation='relu'),Dense(output_dim=output_num_units, input_dim=hidden5_num_units, activation='softmax'),])

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

註意這裡lambda的值等於0.0001. 太棒了!我們獲得了一個比之前NN模型更好的準確率。

現在嘗試一下L1正則化。

## l1model = Sequential([Dense(output_dim=hidden1_num_units, input_dim=input_num_units, activation='relu',kernel_regularizer=regularizers.l1(0.0001)),Dense(output_dim=hidden2_num_units, input_dim=hidden1_num_units, activation='relu',kernel_regularizer=regularizers.l1(0.0001)),Dense(output_dim=hidden3_num_units, input_dim=hidden2_num_units, activation='relu',kernel_regularizer=regularizers.l1(0.0001)),Dense(output_dim=hidden4_num_units, input_dim=hidden3_num_units, activation='relu',kernel_regularizer=regularizers.l1(0.0001)),Dense(output_dim=hidden5_num_units, input_dim=hidden4_num_units, activation='relu',kernel_regularizer=regularizers.l1(0.0001)),Dense(output_dim=output_num_units, input_dim=hidden5_num_units, activation='softmax'),])model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])trained_model_5d = model.fit(x_train, y_train, nb_epoch=epochs, batch_size=batch_size, validation_dat

這次並沒有顯示出任何的改善。我們再來試試dropout技術。

## dropoutfrom keras.layers.core import Dropoutmodel = Sequential([Dense(output_dim=hidden1_num_units, input_dim=input_num_units, activation='relu'),Dropout(0.25),Dense(output_dim=hidden2_num_units, input_dim=hidden1_num_units, activation='relu'),Dropout(0.25),Dense(output_dim=hidden3_num_units, input_dim=hidden2_num_units, activation='relu'),Dropout(0.25),Dense(output_dim=hidden4_num_units, input_dim=hidden3_num_units, activation='relu'),Dropout(0.25),Dense(output_dim=hidden5_num_units, input_dim=hidden4_num_units, activation='relu'),Dropout(0.25),Dense(output_dim=output_num_units, input_dim=hidden5_num_units, activation='softmax'),])model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])trained_model_5d = model.fit(x_train, y_train, nb_epoch=epochs, batch_size=batch_size, validation_data=(x_test, y_test))

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

效果不錯!dropout也在簡單NN模型上給出了一些改善。

現在,我們試試數據增強。

from keras.preprocessing.image import ImageDataGeneratordatagen = ImageDataGenerator(zca_whitening=True)# loading datatrain = pd.read_csv(os.path.join(data_dir, 'Train', 'train.csv'))temp = []for img_name in train.filename:image_path = os.path.join(data_dir, 'Train', 'Images', 'train', img_name)img = imread(image_path, flatten=True)img = img.astype('float32')temp.append(img)x_train = np.stack(temp)X_train = x_train.reshape(x_train.shape[0], 1, 28, 28)X_train = X_train.astype('float32')

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

## splittingy_train = keras.utils.np_utils.to_categorical(train.label.values)split_size = int(x_train.shape[0]*0.7)x_train, x_test = X_train[:split_size], X_train[split_size:]y_train, y_test = y_train[:split_size], y_train[split_size:]## reshapingx_train=np.reshape(x_train,(x_train.shape[0],-1))/255x_test=np.reshape(x_test,(x_test.shape[0],-1))/255## structure using dropoutfrom keras.layers.core import Dropoutmodel = Sequential([Dense(output_dim=hidden1_num_units, input_dim=input_num_units, activation='relu'),Dropout(0.25),Dense(output_dim=hidden2_num_units, input_dim=hidden1_num_units, activation='relu'),Dropout(0.25),Dense(output_dim=hidden3_num_units, input_dim=hidden2_num_units, activation='relu'),Dropout(0.25),Dense(output_dim=hidden4_num_units, input_dim=hidden3_num_units, activation='relu'),Dropout(0.25),Dense(output_dim=hidden5_num_units, input_dim=hidden4_num_units, activation='relu'),Dropout(0.25),Dense(output_dim=output_num_units, input_dim=hidden5_num_units, activation='softmax'),])model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])trained_model_5d = model.fit(x_train, y_train, nb_epoch=epochs, batch_size=batch_size, validation_data=(x_test, y_test))

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

哇!我們在準確率得分上有了一個飛躍。並且好消息是它每次都奏效。我們只需要根據數據集中的圖像來選擇一個合適的實參。

現在,試一下最後一種技術——提前停止。

from keras.callbacks import EarlyStoppingmodel.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])trained_model_5d = model.fit(x_train, y_train, nb_epoch=epochs, batch_size=batch_size, validation_data=(x_test, y_test), callbacks = [EarlyStopping(monitor='val_acc', patience=2)])

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

可以看到我們的模型在僅僅5輪迭代後就停止了,因為驗證集準確率不再提高了。當我們使用更大值的epochs來運行它時,它會給出好的結果。你可以說它是一種優化epoch值的技術。

結語

我希望現在你已經理解了正則化以及在深度學習模型中實現正則化的不同技術。 無論你處理任何深度學習任務,我都強烈建議你使用正則化。它將幫助你開闊視野並更好的理解這個主題。

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

資深程式員帶你玩轉深度學習中的正則化技術(附Python代碼)!

歡迎關註我的博客或者公眾號,咱麽一起學習:https://home.cnblogs.com/u/Python1234/ Python學習交流

歡迎加入我的千人交流學習答疑群:125240963

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1 URL含義 URL的格式由三部分組成: ①第一部分是協議(或稱為服務方式)。 ②第二部分是存有該資源的主機IP地址(有時也包括埠號)。 ③第三部分是主機資源的具體地址,如目錄和文件名等。 2 分析扒網頁的方法 首先調用的是urllib2庫裡面的urlopen方法,傳入一個URL,這個網址是百度 ...
  • 盲維 我總愛重覆一句芒格愛說的話: To the one with a hammer, everything looks like a nail. (手中有錘,看什麼都像釘) 這句話是什麼意思呢? 就是你不能只掌握數量很少的方法、工具。 否則你的認知會被自己能力框住。不只是存在盲點,而是存在“盲維” ...
  • JAVA反射機制是在運行狀態中,對於任意一個類,都能夠知道這個類的所有屬性和方法,對於任意一個對象,都能夠調用它的任意一個方法。這種動態獲取的以及動態調用對象的方法的功能稱為java語言的反射機制。 簡單來說, 就可以把.class文件比做動物的屍體, 而反射技術就是對屍體的一種解剖.通過反射技術, ...
  • 需要先增加一個自定義的Filter去繼承 UsernamePasswordAuthenticationFilter 或者 AbstractAuthenticationProcessingFilter 然後在自定義的Filter裡面指定登錄的Url . 設置過濾器的時候,必須為過濾器指定一個 auth ...
  • GIL(全局解釋器鎖) 每個線程在執行的過程都需要先獲取GIL 作用:在單核的情況下實現多任務(多線程),保證同一時刻只有一個線程可以執行代碼,因此造成了我們使用多線程的時候無法實現並行 多核的情況下產生gil問題 因為一個進程中有一個gil鎖,在這進程裡面的線程去搶這把鎖,在同一時刻只有一個線程能 ...
  • 內建的 datetime 模塊 讓我們看看其他庫是如何處理這種轉換的。 Dateutil 通過 Arrow datetime 類的實例,你可以訪問 Arrow 的其他有用方法。例如,它的humanize()方法將日期時間翻譯成人類可讀的短語,就像這樣: 由於 Maya 與 datetime 庫中很多 ...
  • 1. 學習計劃 第一天 1、SpringMVC介紹 2、入門程式 3、SpringMVC架構講解 a) 框架結構 b) 組件說明 4、SpringMVC整合MyBatis 5、參數綁定 a) SpringMVC預設支持的類型 b) 簡單數據類型 c) Pojo類型 d) Pojo包裝類型 e) 自定 ...
  • 在Spring Cloud封裝的Feign中並不直接支持傳文件,但可以通過引入Feign的擴展包來實現,本來就來具體說說如何實現。 原文:http://blog.didispace.com/spring cloud starter dalston 2 4/ 服務提供方(接收文件) 服務提供方的實現比 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...