我們見慣了上古時代,由電子管組成的時鐘。在 AI 時代,有沒有更加新潮的時間顯示方式?是的,數據集也能做成時鐘,每天早上,讓 MNIST 手寫數字喚醒你一天的記憶。 MNIST 是電腦視覺中不老的經典,當第一代捲積神經網路在這個手寫數字數據集上綻放出耀眼的光芒,它註定會載入「史冊」。 儘管目前 ...
我們見慣了上古時代,由電子管組成的時鐘。在 AI 時代,有沒有更加新潮的時間顯示方式?是的,數據集也能做成時鐘,每天早上,讓 MNIST 手寫數字喚醒你一天的記憶。
MNIST 是電腦視覺中不老的經典,當第一代捲積神經網路在這個手寫數字數據集上綻放出耀眼的光芒,它註定會載入「史冊」。
儘管目前電腦視覺已經早就走出了 MNIST 數據集的時代,甚至連一千多萬圖像的 ImageNet 也不再是非常大的一個圖像數據集。然而,MNIST 仍然不可忽視,深度學習入門的第一個數據集、驗證演算法的第一個實驗都是它。甚至連 Hinton 驗證 Capsule 這個想法的數據集都用的它。
如果說想要致敬這樣的數據集「先驅」,你會採用什麼樣的方式?在 GitHub 中,機器之心發現一個有意思的小項目,作者 Dheera Venkatraman 做了一面鐘,裡面的數字都是從 MNIST 數據集中採樣的。
項目地址:https://github.com/dheera/mnist-clock
也就是說,24 小時隨機抽萬張不同的手寫數字,每天都不帶重樣。做出來的效果是這樣的:
這樣的電子鐘只需要簡單的電路板再加上 4 塊電子墨水屏就行了,它背後的樣子是這樣的:
硬體
項目使用了 TinyPICO 開發板;緊湊的 ESP32 板以及大量的 GPIO 插腳、4MB 快閃記憶體、Wi-Fi,以及其他很多功能。TinyPICO 可以說是目前世界上基於 ESP32-PICO-D4 體積最小的開發板,240 MHz 的 32 位雙核處理器足夠我們完成計算。
4 塊 e-link 數字顯示器,之所以選擇 e-link,是因為它符合手寫數字的概念,在任何光線條件下都能正常運行,而且也不至於打擾到任何人。Waveshare 的 e-link 顯示屏大部分是 SPI,雖然也有些額外的引腳。大部分人會希望一塊只包含 SPI 以及一塊 CS 插腳,但多一些的鏈接器是有必要的。下麵是 ESP32 的連接圖,根據這個把電線捲起來。
作者在 TinyPICO 上使用的是兩個 10-引腳的 JST-EH 的連接器,JST-EH 比 JST-XH 使用更低的配置,更適合插入,以及比標準引腳更短更安全。
JST-EH 連接器所連接的 TinyPICO
下麵,再見硬體固定在 3D 列印的外殼上,就大功告成了:
如果讀者們對硬體不熟悉,那也不要急,我們只要按照項目作者給出的硬體,並裝配好就行了。後面我們會介紹所有「裝備」的價格以及作者提供了設計圖。
軟體
項目作者 Dheera Venkatraman 表示,他經常寫 C++或者 C,但他對 MicroPython 非常有興趣,因此在這個項目中採用的就是它。
項目作者使用每像素 2 比特的灰度深度來表示 MNIST 手寫數字。在這種比特深度下一張 28*28 像素的圖像只需要 196 位元組,因此一個 4MB 的快閃記憶體就能滿足整個 MNIST驗證集。如果你想把整個數據集都裝進去,那麼也只需要換快閃記憶體更大的微控制器、或者使用 1 比特深度的圖像、或者使用壓縮方法等。
將所有文件放在 TinyPICO 根目錄中的/ code 中,正確的文件大概如下圖所示。
另外,我們還需要為 Wi-Fi 創建一個名為.wifi 的文件,中間寫上 yourssid 與 yourpassword,具體的讀取 WIFI 設置的代碼就如下所示。
項目作者 Dheera Venkatraman 在 GitHub 中提供了所有代碼文件,列印鐘錶數字的代碼也非常易讀。更友善的的是,作者的代碼提供了非常完善的註釋,基本重要的語句都有解讀。
現實一點,做一塊多少錢?
如果從硬體來看,似乎主要成本就是 TinyPICO 開發板以及四塊 e-ink 屏。首先 TinyPICO 在淘寶或者國外網站都能買到,國外賣 20 美元,而淘寶上標價 235 元,加上運費其實也差不多。此外,讀者也可以選擇專門的元器件商城,其價格也在 200 塊左右。
其次,一塊 e-ink 屏大概 24 美元,雖然淘寶找不到,但是國內的元器件商城要便宜得多,一塊只需要 92 元左右,可能樹莓派對它的需求比較大吧。
其它的成本就比較少了,線材、連接器裝時鐘的外包裝都比較容易獲得,在國內的元器件商城也可以一次性買到。如果讀者想 3D 列印外包裝,作者也提供了具體的列印參數。所以,總的來說,製作成本應該是低於 650 元的,其中開發板和電子屏都可以在其它項目中再利用。
也許我們還能改進該項目作者的實現,在一塊大的墨水屏上實現數字時鐘,直接使用更常用的樹莓派作為主板(功耗遠高於 TinyPICO),並實現更多的能力,例如實時採樣個 CIFAR-10 作為背景。總之,MNIST 數字時鐘還有很多可以玩的地方。
最後,所有硬體與軟體的詳細信息都可查閱原項目。此外,值得一提的是,Dheera Venkatraman 還是非常有意思的一位小哥哥,他從杭州到北京沿著人類歷史上最長的人工河靠自行車騎了 1600 公裡。
Last But Not Least
確實 MNIST 站在舞臺中央的時代已經過去了,但它的作用仍然不可忽視,仍然有很多研究者致力於改進並修複它,做出獨特的貢獻。
2017 年,德國時尚科技公司 Zalando 提供了 Fashion MNIST 數據集,它的大小、格式和訓練集 / 測試集劃分與原始的 MNIST 完全一致,從 MNIST 遷移到它,我們不需要修改任何代碼。
去年 6 月份,NYU 和 Facebook 的研究者重建並擴展了 MNIST 數據集,在測試集中新增了 50000 個樣本,將測試集增加到 6 萬樣本。MNIST 作者之一的 Yann LeCun 表示,「如果多次使用原版的 MNIST 測試集,你的模型可能在測試集上已經過擬合了,是時候在新增的樣本上試一下了。」
不論是將 MNIST 做成日常生活中好看又好玩的項目,還是提升數據集本身的能力,MNIST 一直都會是活著的歷史~