學習筆記TF014:捲積層、激活函數、池化層、歸一化層、高級層

-Advertisement-

CNN神經網路架構至少包含一個捲積層 (tf.nn.conv2d)。單層CNN檢測邊緣。圖像識別分類，使用不同層類型支持捲積層，減少過擬合，加速訓練過程，降低記憶體占用率。 TensorFlow加速所有不同類弄捲積層捲積運算。tf.nn.depthwise_conv2d，一個捲積層輸出邊接到另一個捲積 ...

CNN神經網路架構至少包含一個捲積層 (tf.nn.conv2d)。單層CNN檢測邊緣。圖像識別分類，使用不同層類型支持捲積層，減少過擬合，加速訓練過程，降低記憶體占用率。

TensorFlow加速所有不同類弄捲積層捲積運算。tf.nn.depthwise_conv2d，一個捲積層輸出邊接到另一個捲積層輸入，創建遵循Inception架構網路 Rethinking the Inception Architecture for Computer Vision
https://arxiv.org/abs/1512.00567 。tf.nn.separable_conv2d，規模較大模型不犧牲準確率加速訓練，規模小模型快速收斂但準確率低。tf.nn.conv2d_transpos，捲積核用於新特征圖，每部分填充捲積核相同值，捲積核遍歷新圖像，重疊部分相加。斯坦福大學課程CS231n Winter 2016:Lecture 13。

激活函數與其他層輸出生成特征圖，對某些運算結果平滑(微分)，為神經網路引入非線性(輸入輸出曲線關係)，刻畫輸入複雜變化，訓練複雜模型。激活函數主要因素，單調，輸出隨輸入增長，可用梯度下降法找局部極值點；可微分，定義域內任意一點有導數，輸出可用梯度下降法。
tf.nn.relu，修正線性單元，斜坡函數。分段線性，輸入非負輸出相同，輸入為負輸出為0。不受“梯度消失”影響，取值範圍[0, +∞]。較大學習速率時，易受飽和神經元影響。損失信息但性能突出。輸入秩1張量(向量)，小於0置0，其餘分量不變。
tf.sigmoid，只接收浮點數，返回區間[0.0, 1.0]內的值。輸入值較大返回接近1.0，輸入值較小返回接近0.0。適用於真實輸出位於[0.0, 1.0]。輸入接近飽和或變化劇烈，輸出範圍縮減成為問題。輸入0，輸出0.5，sigmoid函數值域中間點。
tf.tanh，雙曲正切函數，值域[-1.0, 1.0]，有輸出負值能力。值域中間點為0.0。網路下層期待輸入為負值或0.0，會有問題。
tf.nn.dropout，依據可配置概率輸出設0.0。適合少量隨機性有助於訓練。keep_prob參數指定輸出保持概率。每次執行，不同輸出。丟棄輸出設為0.0。

池化層減少過擬合，減小輸入尺寸，提高性能。輸入降採樣，為後續層保留重要信息。池化層減小尺寸效率比tf.nn.conv2d高。
tf.nn.max_pool，跳躍遍歷張量，捲積核覆蓋元素最大數值作捲積結果。適合輸入數據灰度與圖像重要性相關。輸入為前一層輸出，非直接圖像。跨度strides使用image_height、image_width遍歷輸入。只保留輸入張量最大元素。最大池化(max-pooling)，利用接受域(捲積核)完成。2X2接受域，單個通路最小數量降採樣。1X1接受域，輸出輸入相同。
tf.nn.avg_pool，跳躍遍歷張量，捲積核覆蓋各深度值取平均。適合捲積核重要，實現值縮減。如輸入張量寬度高度大，深度小。

tf.nn.relu是無界函數，歸一化識別高頻特征。tf.nn.local_response_normalization(tf.nn.lrn)，局部響應歸一化，給定向量，每個分量被depth_radius覆蓋輸入加權和除。輸入保持在可接受範圍。考慮每個值重要性。歸一化輸出調整到區間[-1.0, 1.0]。

高級層減少代碼冗餘，遵循最佳實踐。
tf.contrib.layers.convolution2d。權值初始化、偏置初始化、可訓練變數輸出、偏置相加、添加激活函數。捲積核，可訓練變數。權值初始化用於捲積核首次運行值填充(tf.truncated_normal)。簡單元組形式表示捲積核高度和寬度。輸入圖像，tf.image.convert_image_dtype，調整各分量表示顏色值。TensorFlow要求浮點型描述圖像顏色，分量在[0, 1]。
tf.contrib.layers.fully_connected。全連接層，每個輸入輸出存在連接。CNN最後一層常是全連接層。TensorFlow全連接層格式，tf.matmul(features,weight)+bias。輸入張量與輸出層每個神經元連接。

原始輸入需要傳遞給輸入層。目標識別與分類輸入層tf.nn.conv2d。

    import tensorflow as tf
    features = tf.range(-2, 3)
    print features
    sess = tf.Session()
    print sess.run([features, tf.nn.relu(features)])
    features2 = tf.to_float(tf.range(-1, 3))
    print features2
    print sess.run([features2, tf.sigmoid(features2)])
    print sess.run([features2, tf.tanh(features2)])
    features3 = tf.constant([-0.1, 0.0, 0.1, 0.2])
    print features3
    print sess.run([features3, tf.nn.dropout(features3, keep_prob=0.5)])
    batch_size = 1
    input_height = 3
    input_width = 3
    input_channels = 1
    layer_input = tf.constant([
            [
                [[1.0], [0.2], [1.5]],
                [[0.1], [1.2], [1.4]],
                [[1.1], [0.4], [0.4]]
            ]
        ])
    print layer_input
    kernel = [batch_size, input_height, input_width, input_channels]
    print kernel
    max_pool = tf.nn.max_pool(layer_input, kernel, [1, 1, 1, 1], "VALID")
    print max_pool
    print sess.run(max_pool)
    layer_input2 = tf.constant([
            [
                [[1.0], [1.0], [1.0]],
                [[1.0], [0.5], [0.0]],
                [[0.0], [0.0], [0.0]]
            ]
        ])
    print layer_input2
    avg_pool = tf.nn.avg_pool(layer_input2, kernel, [1, 1, 1, 1], "VALID")
    print avg_pool
    print sess.run(avg_pool)
    layer_input3 = tf.constant([
            [
                [[1.], [2.], [3.]]
            ]
        ])
    print layer_input3
    lrn = tf.nn.local_response_normalization(layer_input3)
    print lrn
    print sess.run([layer_input3, lrn])
    image_input = tf.constant([
            [
                [[0., 0., 0.], [255., 255., 255.], [254., 0., 0.]],
                [[0., 191., 0.], [3., 108., 233.], [0., 191., 0.]],
                [[254., 0., 0.], [255., 255., 255.], [0., 0., 0.]]
            ]
        ])
    print image_input
    conv2d = tf.contrib.layers.convolution2d(
        image_input,
        num_outputs=4,
        kernel_size=(1,1),
        activation_fn=tf.nn.relu,
        stride=(1,1),
        trainable=True)
    print conv2d
    sess.run(tf.global_variables_initializer())
    print sess.run(conv2d)
    features4 = tf.constant([
            [[1.2], [3.4]]
        ])
    print features4
    fc = tf.contrib.layers.fully_connected(features4, num_outputs=2)
    print fc
    sess.run(tf.global_variables_initializer())
    print sess.run(fc)

參考資料：
《面向機器智能的TensorFlow實踐》

歡迎加我微信交流：qingxingfengzi
我的微信公眾號:qingxingfengzigz
我老婆張幸清的微信公眾號：qingqingfeifangz

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Amazing ASP.NET Core 2.0

前言 ASP.NET Core 的變化和發展速度是飛快的，當你發現你還沒有掌握 ASP.NET Core 1.0 的時候， 2.0 已經快要發佈了，目前 2.0 處於 Preview 1 版本，意味著功能已經基本確定，還沒有學習過 ASP.NET Core 的同學可以直接從 2.0 開始學起，但是如 ...
Html內容

Html 內容 Html就是超文本標記語言的簡寫，是最基礎的網頁語言。 Html是通過標簽來定義的語言，代碼都是由標簽所組成。 Html代碼不用區分大小寫。 Html代碼由<html>開始</html>結束。裡面由頭部分<head></head>和體部分<body></body>兩部分組成。頭部分 ...
C#事件總結與應用

C#事件總結與應用什麼是事件？事件是特殊化的委托，委托是事件的基礎，所以在介紹事件之前先介紹一下委托通俗的說就是：事件就是消息驅動器通過委托類來調用感興趣的方法，事實上事件調用是間接的調用就像是顯示中我的代理人一樣發佈者與訂閱者在學習事件的時候們首先要明白什麼是發佈者什麼是訂閱者：通 ...
Angularjs學習筆記

一、constant 該函數可以將變數註冊在模塊中，並以服務的形式進行使用。例如： var app = angular.module("MyModule",[]).constant("pageConfig",{pageSize:10}); 通過以上方式就定義了一個模塊中可用的pageConfig的 ...
CentOS上實現一鍵Maven打包並部署到Tomcat的Shell腳本

CentOS上實現一鍵Maven打包並部署到Tomcat的Shell腳本給這個Shell腳本取個名字，比如叫 deploylab, 將deploylab移到任何已經在系統環境變數的bin目錄下，如：然後就可以在任意位置直接輸入命令 deploylab 一鍵部署最新代碼到Tomcat了。 ...
淺談 Java 主流開源類庫解析 XML

在大型項目編碼推進中，涉及到 XML 解析問題時，大多數程式員都不太會選用底層的解析方式直接編碼。主要存在編碼複雜性、難擴展、難復用....，但如果你是 super 程式員或是一個人的項目，也不妨一試。 Jdom/Dom4j/Xstream... 基於底層解析方式重新組織封裝的開源類庫，簡潔明瞭的 ...
電腦程式的思維邏輯 (87) - 類載入機制

本節探討Java中的類載入機制，利用自定義的ClassLoader實現熱部署 ...
Myeclipse2016安裝Aptana

Myeclipse2016安裝Aptana 想裝個Aptana，裝了半天，網上說的什麼links方式啊，線上方式啊，都是什麼的浮雲。所以自己來寫個安裝教程。一、Aptana簡要介紹 Aptana有JavaScript,JavaScript函數,HTML,CSS語言的Code Assist功能。 ...