因特爾黑科技:黑暗中快速成像系統

来源:https://www.cnblogs.com/mylanqiu/archive/2018/10/09/9758463.html
-Advertisement-
Play Games

想在黑暗中看清周圍,不可避免地要用到夜視儀。那麼如果是想在黑暗中拍照,又沒有閃光燈,如何才能排到清晰的照片?在CVPR 2018上,英特爾實驗室的Vladlen Koltun和陳啟峰帶領的團隊提出了一種在黑暗中快速成像的系統,效果非常贊。 在暗光下的圖像易受到低信噪比和低亮度的影響。短曝光的照片會出 ...


想在黑暗中看清周圍,不可避免地要用到夜視儀。那麼如果是想在黑暗中拍照,又沒有閃光燈,如何才能排到清晰的照片?在CVPR 2018上,英特爾實驗室的Vladlen Koltun和陳啟峰帶領的團隊提出了一種在黑暗中快速成像的系統,效果非常贊。
在暗光下的圖像易受到低信噪比和低亮度的影響。短曝光的照片會出現很多早點,而長曝光會讓照片變得模糊、不真實。目前已經有很多去噪、去模糊、圖像增強的技術,但是在極端條件下,他們的作用就很有限了。為了發展基於學習的低光度圖像處理,我們引入了一個數據集,內含有原始短曝光低亮度圖片,同時還有對應的長時間曝光的圖像。利用該數據集。我們創建了一個機遇端到端訓練的全捲積網路,用於處理低亮度圖像。網路直接使用原始感測器數據,並替代了大量傳統圖像處理的流程。最終我們發現新數據集的結果很有前景。

概述
噪點在任何成像系統中都存在,但在亮度較低的環境中成像就更加困難。提高ISO可以增加亮度,但也會造成更多噪點。後期處理也是改善噪點過多的方法,但這並不能解決信噪比(SNR)低的問題。其他手段雖然能提高SNR,但都有各自的缺陷。

的確,在低亮度中快速成像的問題一直沒有好的解決方法。研究人員提出了各種去噪、去模糊、提高亮度的技術。但這些技術都是假設照片是在略暗淡、稍有噪點的環境中捕捉到的。相反,我們想研究的是在非常黑暗的情況下的成像效果,例如月光下。在這種條件下,傳統相機成像的過程就無能為力了,圖片必須用原始感測器數據重新構建。

我們提出的系統效果(最右)如圖1所示:

圖1
左圖中,環境中的亮度極低,相機的亮度小於0.1lux,快門速度為1/30,光圈為f/5.6,ISO為8000(通常這已經很高了)。但是照相機照出來仍然是漆黑一片(這可是用索尼全畫幅感測器)。

中間圖中,把ISO調到409600,這已經超過了大多數相機的極限了,可以看到照出來的圖像了,但是圖像顯得很暗,噪點較多,色彩失真。

而最右邊我們的方法則清晰了許多。具體來說,我們訓練了深度神經網路學習處理低亮度原始圖像數據的過程,包括色彩轉化、去馬賽克、減少噪點、圖像質量提高等等。

數據集
目前大多數處理低亮度的圖片都是在合成數據或沒有對應標準的低亮度圖像上進行的,據我們所知,沒有一個公開數據集可以用來訓練或是測試低亮度圖像處理。於是,我們就新建了一個數據集,稱為See-in-the-Dark(SID)。數據集中共有5094張圖像,它們都是在低亮度條件下捕捉到的、快速曝光的原始圖像。每個低亮度圖片都有對應的長時間曝光高質量圖片(註意,一張高質量圖片可能對應多張低亮度圖片)。

數據集包括室內和室外的圖像,室外圖像大多於夜晚拍攝,光源來自月光或者路燈。室外場景的相機亮度在0.2lux和5lux之間。室內圖像就更暗一些了,通常在0.03lux到0.3lux之間。

輸入圖像的曝光時間通常在1/30秒到1/10秒之間,相對應的正常圖片的曝光時間為10到30秒。數據集的具體參數可看下表:

經過長時間曝光的正常圖片仍含有少許噪點,但是從視覺上已經達到標準圖片的水平了。我們希望我們創建的應用可以在低光度環境下生成表現良好的圖像,而不是徹底消除所有噪點或讓圖像對比度最大化。

模型成像方法
從成像感測器中得到原始數據後,傳統圖像處理過程會應用一系列模塊,例如白平衡、去馬賽克、去噪、增加銳度等等。而這些模塊只是在某些相機中才有。Jiang等人提出,用本地、線性、可學習的(L3)過濾器來模型現代成像系統中複雜的非線性流程。但是,這些方法都無法成功解決在低亮度中快速成像的問題,還是由於極低的SNR問題。之後,Hasinoff等人對智能手機上的相機提出了bursting imaging成像方法,通過結合多張圖像可以生成效果較好的圖像,但是複雜程度較高。

對此,我們提出了的端到端的學習方法,即訓練一個全捲積網路(FCN)進行圖像處理。圖2展示了我們所提出的圖像處理架構:

對於拜耳陣列,我們將輸入的圖像打包到四個通道中,並相應地將空間解析度在每個維度上降低。對於X-Trans陣列(圖中未顯示),原始數據是按6×6排列的,我們將其打包放到9個通道中。打包後的數據輸入到全捲積網路中,輸出一個有12通道的圖像,空間向量僅為一半。而這個半尺寸的輸出被次像素圖層處理後,可以恢復到原始解析度。

基本介紹之後,我們要重點瞭解一下網路中兩個重要的結構:一個多尺寸文本聚合網路(CAN)和U-net。其他工作研究了殘差連接,但是我們認為這對我們的模型用處不大,可能是因為我們的輸入和輸出在不同的顏色空間中表示。另一個影響模型結構選擇的是記憶體消耗,我們的架構可以在GPU上處理全解析度的圖像。由此避免了全連接的圖層,他們還需要處理小的圖像補丁,然後重新進行組合。我們預設的架構是u-net。

放大比例決定了輸出圖像的亮度。在我們的圖像生成流程中,放大比例是外部決定的,並且是作為圖像流程的輸入,類似於相機的ISO。圖3顯示了不同的放大倍數的結果,用戶可以自己調整以改變亮度。

最終網路利用L1損失和Adam優化器從零開始訓練。

實驗過程
首先,將我們提出的方法與傳統方法的對比,得到以下結果:

可以看出,我們的方法生成的圖片比傳統方法優秀得多。

同時,我們認為專門用特定的相機感測器進行訓練的網路總能達到最佳效果。但是,最初的實驗表明這不是一定的。我們將一個在索尼套件上訓練的模型應用於由iPhone 6S拍攝出的相片上,其中通要包含一個拜耳過濾陣列和14位的原始數據。我們用一款app手動設置ISO和其他參數,輸出原始數據用於處理。最終的結果如圖5所示。傳統方法處理的數據有很多噪點,色差較大。而我們的網路生成的圖片對比度較強、噪點少並且顏色正常。

結語
由於極少的光子數量和極低的信噪比,在黑暗環境中成像一直是個大難題。想以視頻速率在黑暗中成像,對於傳統的信號處理方法來說幾乎是不可能的。而我們提出的See-in-the-Dark數據集、全捲機的網路證明瞭這種在極端條件下成像的可能。最後的實驗也證明這種方法行之有效,我們希望這項工作能在未來提供更多幫助。

本文轉載自:http://www.dalbll.com/Group/Topic/ArchitecturedDesign/5084


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 用JS生成動態生成表格,行、列由用戶輸入,並使表格隔行換色 方法一. 代碼: 運行結果: 輸入行數、列數,create Table: 方法二. 代碼: 運行結果: 輸入行數、列數: *僅供參考,轉載請註明 *代碼①參考:https://www.cnblogs.com/hwgok/p/5739822. ...
  • [科學上網]Node.js 種子下載器 慶祝 2018 國慶,製作了一個 的種子下載器。爬取頁面,根據頁面的鏈接,破解另外一個網站,下載種子文件,同時使用 模塊提高爬蟲的併發量。項目比較簡單,爬取頁面沒有使用任何爬蟲框架。 "源碼傳送門" 。 的安裝請看我的另外一篇文章, "Node.js 的多版本 ...
  • 1》OL標簽的改良 start type reversed:翻轉排序 2》datalist標簽自動補全的使用 3》progress標簽的使用:進度條 4》meter標簽的應用 5》details展開收縮標簽的使用-子標簽summary(自動帶有展開收縮的效果) 6》mark標簽的應用:高亮顯示文本 ...
  • 隨著flash的沒落,瀏覽器的原生能力的興起。在3D方面WebGL不管從功能還是性能方面都在逐漸加強。2D應用變為3D應用的需求也越來越強烈。 win10的畫圖板支持3D圖片,2d工具photoshop也開始逐步集成了3D工具。 下麵就基於WebGL技術探討一下現在的兩款3D框架。Threejs(h ...
  • 網上很多關於驗證小數的正則表達式,但是很多都不是百分百正確,所以我結合一些前輩的經驗,自己寫了一個。 驗證非0開頭的無限位整數和小數。整數支持無限位,小數點前支持無限位,小數點後最多保留兩位。 js代碼如下: var reg = /^(([^0][0-9]+|0)\.([0-9]{1,2})$)|^ ...
  • 近幾年,微服務架構在後端技術社區大紅大紫,它被認為是IT軟體架構的未來技術方向.我們如何借鑒後端微服務的思想來構建一個現代化前端應用? 在這裡我提供一個可以在產品中真正可以落地的前端微服務解決方案. 微服務化後端前後端對比 後端微服務化的優勢: 1. 複雜度可控: 體積小、複雜度低,每個微服務可由一 ...
  • 在Bootstrap fileinput中移除預覽文件時可以通過配置initialPreviewConfig: [ { url:'deletefile',key:fileid } ] 來同步刪除伺服器上的文件和記錄。但新上傳的文件則需要其他方式來同步刪除伺服器記錄。 在配置中遇到的一些問題,記錄一下 ...
  • 數據流轉 先上一張圖看清 Westore 怎麼解決小程式數據難以管理和維護的問題: 非純組件的話,可以直接省去 triggerEvent 的過程,直接修改 store.data 並且 update,形成縮減版單向數據流。 "Github: https://github.com/dntzhang/we ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...