捲積神經網路對圖片分類-下

来源:http://www.cnblogs.com/azheng333/archive/2016/09/13/5868465.html
-Advertisement-
Play Games

接上篇:捲積神經網路對圖片分類-中 9 ReLU(Rectified Linear Units) Layers 在每個捲積層之後,會馬上進入一個激勵層,調用一種激勵函數來加入非線性因素,決絕線性不可分的問題。這裡我們選擇的激勵函數方式叫做ReLU, 他的方程是這樣f(x) = max(0, x),就 ...


接上篇:捲積神經網路對圖片分類-中

 

9 ReLU(Rectified Linear Units) Layers

在每個捲積層之後,會馬上進入一個激勵層,調用一種激勵函數來加入非線性因素,決絕線性不可分的問題。這裡我們選擇的激勵函數方式叫做ReLU, 他的方程是這樣f(x) = max(0, x),就是把小於零的值都歸為0,好處是可以是網路訓練的更快,減少梯度消失的問題出現。具體如何理解,例如:

上圖A中可以通過一條直線來區分2種不同類型的數據點,然而B就不可以。但是調用激勵函數經過變換之後就可以對它們進行很好的區分。

 

10 訓練

到目前為止大家肯定會有一些疑問,捲積層是如何知道提取哪些特征圖像,過濾器里的權重值是如果被確定的,全連接層是如何進行對比的。

接下來我們就來看看,網路是如何被訓練的。其實網路在訓練的過程中電腦是通過反向傳播演算法來調整過濾器的權重值。在講解反向傳播演算法之前我們先來看一個類比。

 

當我們生下來的時候,我們的思想是嶄新的,不知道什麼是鳥什麼是狗。類似在CNN在開始訓練之前,權重值也是隨機初始化的,過濾器不知道提取哪些特征值。當我們長大一些的時候,父母和老師給我們看不同的圖片並且告訴我們這些圖片對應的是什麼。這種思想或者方法就是給圖片打標簽,就是CNN訓練的過程。在CNN訓練之前,其實我們已經有一些訓練樣本,裡面有成千上萬張貓,狗,鳥,船的圖片,並且每一張圖片都有一個對應的標簽說明它是什麼動物,例如有一張訓練圖片被標記為狗,它的標簽是[0 0 0 1 0 0 0 0 0 0],屬於它的分類對應的位置被標記為1,其他不屬於它的分類位置被標記為0值。

 

反向傳播演算法可以分成4個不同的部分,向前傳遞,損失函數,反向傳遞,更新權重。在向前傳播過程中,你拿到一張訓練圖片28X28X3的數組,通過網路傳遞它。剛開始所有的權重值都被隨機初始化,它們可能會是這樣一些隨機值[0.3, 0.1, 0.4, 0.2, 0.3....]。網路通過初始化的權重值,是無法提取準確特征圖像 ,因此無法給出任何合理的結論,圖片屬於哪種類別。這時我們就需要反向傳播中的損失函數來幫助網路更新權重值找到想要的特征圖像。損失函數的定義方式有很多種,但是一種常用方式的是MSE(mean squared erro)均方誤差。


這裡target就是圖片的真實分類值,output就是圖片通過網路訓練出來的分類值,然後調用均方誤差就得到了損失值。這個損失值在網路剛開始訓練的時候可能會很高,這個很好理解因為權重值都是隨機初始化出來的。我們的最終目的就是想要得到預測值和真實值一樣。為了達到這個目的,我們就需要儘量減少損失值,損失值越小就說明預測結果越接近。在這一個過程中,我們就需要不斷的調整權重值,來尋找出哪些權重值能使網路的損失減小。具體怎樣來尋找這些權重值,就需要使用到梯度下降演算法。它的示例圖如下:


剛開始在曲面上有一個點,這個點就是我們的初始化權重,然後不停的更新權重值,讓這個點沿著曲面的邊緣慢慢下降,最終降到最低點,得到一個很小的損失值。在訓練的過程中,你可以指定一個下降速率或者叫做訓練速率,也就是這個點每次移動的步伐。給一個大的訓練速率意味著權重在更新的時候步伐更大,訓練的速度更快,但是當你給的值太大時就有可能在快達到最低點時跳躍過它,這樣就獲取不到最佳權重值了。

做一次前向傳遞,損失函數,反向傳遞和參數更新的過程通常被稱為one epoch。 每次訓練都會指定完成epoch的次數,然後程式就會不斷重覆這一過程,當最後一輪訓練結束之後,我們的網路也就被訓練好了,得到了訓練出來的一些權重值。

 

11 測試

最後,為了檢測訓練出來的CNN模型是否準確,我們需要一些不同的圖片和標簽,把他們傳遞給CNN,用預測出來的結果和真實結果做一下對比就可以知道訓練出來的模型是否準確了。

 

(完)

 

參考:

http://neuralnetworksanddeeplearning.com/chap6.html#convolutional_neural_networks_in_practice

https://adeshpande3.github.io/adeshpande3.github.io/A-Beginner's-Guide-To-Understanding-Convolutional-Neural-Networks/


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • App Store: 電工助手 1. 適配iOS 10 App Store: 電工助手 ...
  • http://wwty.iteye.com/blog/698239 mysql存儲過程也提供了對異常處理的功能:通過定義HANDLER來完成異常聲明的實現 語法如下: DECLARE handler_type HANDLER FOR condition_value[,...] sp_statemen ...
  • http://www.rodneyoliver.com/blog/2013/08/08/retrieving-out-params-from-a-stored-procedure-with-python/ AUG 8TH, 2013 I was hacking some python today w ...
  • https://geert.vanderkelen.org/2014/results-after-procedure-call/ Problem Using MySQL Connector/Python, you are calling a stored procedure which is als ...
  • 在每個MongoDB(版本 3.2.9) Instance中,都有一個本地資料庫(local),用於存儲 Replication 進程的信息和本地數據。local 資料庫的特性是:位於local資料庫中的數據和集合不會被 Replication 進程複製到其他MongoDB instance上。如果 ...
  • 資料庫的設計範式是資料庫設計所需要滿足的規範,滿足這些規範的資料庫是簡潔的、結構明晰的,同時,不會發生插入(insert)、刪除(delete)和更新(update)操作異常。反之則是亂七八糟,不僅給資料庫的編程人員製造麻煩,而且面目可憎,可能存儲了大量不需要的冗餘信息。 ...
  • 【函數】wm_concat包的訂製 1 BLOG文檔結構圖 2 前言部分 2.1 導讀和註意事項 各位技術愛好者,看完本文後,你可以掌握如下的技能,也可以學到一些其它你所不知道的知識,~O(∩_∩)O~: ① 利用系統包創建WM_CONCAT函數(重點) ② ORA-00904: "wm_conca... ...
  • 查找阻塞進程: SELECT blocking_session_id '阻塞進程的ID', wait_duration_ms '等待時間(毫秒)', session_id '(會話ID)' FROM sys.dm_os_waiting_tasks 殺死阻塞進程: KILL 57 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...