捲積神經網路對圖片分類-下

来源:http://www.cnblogs.com/azheng333/archive/2016/09/13/5868465.html
-Advertisement-
Play Games

接上篇:捲積神經網路對圖片分類-中 9 ReLU(Rectified Linear Units) Layers 在每個捲積層之後,會馬上進入一個激勵層,調用一種激勵函數來加入非線性因素,決絕線性不可分的問題。這裡我們選擇的激勵函數方式叫做ReLU, 他的方程是這樣f(x) = max(0, x),就 ...


接上篇:捲積神經網路對圖片分類-中

 

9 ReLU(Rectified Linear Units) Layers

在每個捲積層之後,會馬上進入一個激勵層,調用一種激勵函數來加入非線性因素,決絕線性不可分的問題。這裡我們選擇的激勵函數方式叫做ReLU, 他的方程是這樣f(x) = max(0, x),就是把小於零的值都歸為0,好處是可以是網路訓練的更快,減少梯度消失的問題出現。具體如何理解,例如:

上圖A中可以通過一條直線來區分2種不同類型的數據點,然而B就不可以。但是調用激勵函數經過變換之後就可以對它們進行很好的區分。

 

10 訓練

到目前為止大家肯定會有一些疑問,捲積層是如何知道提取哪些特征圖像,過濾器里的權重值是如果被確定的,全連接層是如何進行對比的。

接下來我們就來看看,網路是如何被訓練的。其實網路在訓練的過程中電腦是通過反向傳播演算法來調整過濾器的權重值。在講解反向傳播演算法之前我們先來看一個類比。

 

當我們生下來的時候,我們的思想是嶄新的,不知道什麼是鳥什麼是狗。類似在CNN在開始訓練之前,權重值也是隨機初始化的,過濾器不知道提取哪些特征值。當我們長大一些的時候,父母和老師給我們看不同的圖片並且告訴我們這些圖片對應的是什麼。這種思想或者方法就是給圖片打標簽,就是CNN訓練的過程。在CNN訓練之前,其實我們已經有一些訓練樣本,裡面有成千上萬張貓,狗,鳥,船的圖片,並且每一張圖片都有一個對應的標簽說明它是什麼動物,例如有一張訓練圖片被標記為狗,它的標簽是[0 0 0 1 0 0 0 0 0 0],屬於它的分類對應的位置被標記為1,其他不屬於它的分類位置被標記為0值。

 

反向傳播演算法可以分成4個不同的部分,向前傳遞,損失函數,反向傳遞,更新權重。在向前傳播過程中,你拿到一張訓練圖片28X28X3的數組,通過網路傳遞它。剛開始所有的權重值都被隨機初始化,它們可能會是這樣一些隨機值[0.3, 0.1, 0.4, 0.2, 0.3....]。網路通過初始化的權重值,是無法提取準確特征圖像 ,因此無法給出任何合理的結論,圖片屬於哪種類別。這時我們就需要反向傳播中的損失函數來幫助網路更新權重值找到想要的特征圖像。損失函數的定義方式有很多種,但是一種常用方式的是MSE(mean squared erro)均方誤差。


這裡target就是圖片的真實分類值,output就是圖片通過網路訓練出來的分類值,然後調用均方誤差就得到了損失值。這個損失值在網路剛開始訓練的時候可能會很高,這個很好理解因為權重值都是隨機初始化出來的。我們的最終目的就是想要得到預測值和真實值一樣。為了達到這個目的,我們就需要儘量減少損失值,損失值越小就說明預測結果越接近。在這一個過程中,我們就需要不斷的調整權重值,來尋找出哪些權重值能使網路的損失減小。具體怎樣來尋找這些權重值,就需要使用到梯度下降演算法。它的示例圖如下:


剛開始在曲面上有一個點,這個點就是我們的初始化權重,然後不停的更新權重值,讓這個點沿著曲面的邊緣慢慢下降,最終降到最低點,得到一個很小的損失值。在訓練的過程中,你可以指定一個下降速率或者叫做訓練速率,也就是這個點每次移動的步伐。給一個大的訓練速率意味著權重在更新的時候步伐更大,訓練的速度更快,但是當你給的值太大時就有可能在快達到最低點時跳躍過它,這樣就獲取不到最佳權重值了。

做一次前向傳遞,損失函數,反向傳遞和參數更新的過程通常被稱為one epoch。 每次訓練都會指定完成epoch的次數,然後程式就會不斷重覆這一過程,當最後一輪訓練結束之後,我們的網路也就被訓練好了,得到了訓練出來的一些權重值。

 

11 測試

最後,為了檢測訓練出來的CNN模型是否準確,我們需要一些不同的圖片和標簽,把他們傳遞給CNN,用預測出來的結果和真實結果做一下對比就可以知道訓練出來的模型是否準確了。

 

(完)

 

參考:

http://neuralnetworksanddeeplearning.com/chap6.html#convolutional_neural_networks_in_practice

https://adeshpande3.github.io/adeshpande3.github.io/A-Beginner's-Guide-To-Understanding-Convolutional-Neural-Networks/


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • App Store: 電工助手 1. 適配iOS 10 App Store: 電工助手 ...
  • http://wwty.iteye.com/blog/698239 mysql存儲過程也提供了對異常處理的功能:通過定義HANDLER來完成異常聲明的實現 語法如下: DECLARE handler_type HANDLER FOR condition_value[,...] sp_statemen ...
  • http://www.rodneyoliver.com/blog/2013/08/08/retrieving-out-params-from-a-stored-procedure-with-python/ AUG 8TH, 2013 I was hacking some python today w ...
  • https://geert.vanderkelen.org/2014/results-after-procedure-call/ Problem Using MySQL Connector/Python, you are calling a stored procedure which is als ...
  • 在每個MongoDB(版本 3.2.9) Instance中,都有一個本地資料庫(local),用於存儲 Replication 進程的信息和本地數據。local 資料庫的特性是:位於local資料庫中的數據和集合不會被 Replication 進程複製到其他MongoDB instance上。如果 ...
  • 資料庫的設計範式是資料庫設計所需要滿足的規範,滿足這些規範的資料庫是簡潔的、結構明晰的,同時,不會發生插入(insert)、刪除(delete)和更新(update)操作異常。反之則是亂七八糟,不僅給資料庫的編程人員製造麻煩,而且面目可憎,可能存儲了大量不需要的冗餘信息。 ...
  • 【函數】wm_concat包的訂製 1 BLOG文檔結構圖 2 前言部分 2.1 導讀和註意事項 各位技術愛好者,看完本文後,你可以掌握如下的技能,也可以學到一些其它你所不知道的知識,~O(∩_∩)O~: ① 利用系統包創建WM_CONCAT函數(重點) ② ORA-00904: "wm_conca... ...
  • 查找阻塞進程: SELECT blocking_session_id '阻塞進程的ID', wait_duration_ms '等待時間(毫秒)', session_id '(會話ID)' FROM sys.dm_os_waiting_tasks 殺死阻塞進程: KILL 57 ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...