提起AI,大家都會先想到Python,確實Python作為一門好幾十年的老語言,上一波的AI大流行使它煥發了青春。大家用Phtyon來做AI,最主要的原因無非就是編碼量更少,很多數學和AI相關的Api都是現成的。但是隨著ML.net的問世,我們現在可以在.netcore平臺上使用比Python更少的 ...
提起AI,大家都會先想到Python,確實Python作為一門好幾十年的老語言,上一波的AI大流行使它煥發了青春。大家用Phtyon來做AI,最主要的原因無非就是編碼量更少,很多數學和AI相關的Api都是現成的。但是隨著ML.net的問世,我們現在可以在.netcore平臺上使用比Python更少的代碼來實現AI的功能了。
ML是Machine Learning的縮寫,從命名上可以看出微軟對於對於AI的現狀還是有非常清醒的認識的。目前我們所有聲稱的人工智慧其實只是機器學習,離真正意義上的人工智慧還差的很遠。這也是為什麼,AI這個概念幾乎每十年就火一次,然後陷入沉寂,因為我們在演算法上其實始終沒有突破,只是硬體比以前強大了,算的比以前快了而已。
上一波的AI創業大軍已經紛紛倒下了,這也使我們認識到目前AI的水平是很難獨立支撐一塊完整的創新業務的,但是作為已有系統的補充,作為數據分析的工具,AI還是很有用的,尤其是在圖像識別,語義分析,數值預測等已有成熟演算法的領域。
讀到這裡是不是以為這篇文章是噴概念的?必須不是啊,乾貨來了:
ML.Net主要特點:
跨平臺,開源,使用簡單,支持Tensorflow等擴展
一、 使用ML.Net的圖形化工具生成機器學習代碼
目前的Visual Studio 2019已經包含了ML.Net的圖形化工具,只不過還是預覽版,需要你手動開啟,首先在Visual Studio Installer里安裝的功能中勾選ML.Net
然後在visual studio的 工具->選項中,選擇展示預覽功能
從這裡我們也可以看出,微軟已經計劃在後續的visual studio中將ML.NET作為預設工具集成進來了。
安裝完畢之後,隨便建一個.netcore的項目,控制台的就可以。右鍵點擊添加就會看到ML.NET的選項,
點擊之後會有圖形界面,然你從幾種常見的需求中選擇,比如語義識別,圖像識別,數值預測等,後續它還會支持圖片中物體識別等更複雜的需求。整個過程非常直觀,按照它的界面一步一步走就可以,它最終會幫你訓練模型並生成使用模型和再次訓練模型的代碼。
二、 手動引用Nuget包進行開發
在已有項目中手動添加AI的支持,只需要從Nuget上手動引用Microsoft.ML包,以及其他任務相關的包,如果需要使用tensorflow訓練的模型,則需要引用SciSharp.TensorFlow.Redist包。訓練和使用模型的代碼都比較簡單,根據機器學習的類型不同,少則10幾行,多則幾十行代碼就可以完成訓練的編碼。
三、 實戰演示
公司內部已有app需要增加一些額外功能,用戶用手機截圖上傳的時候,系統需要判斷圖片有沒有最上方的狀態欄。由於手機本身系統的不同,再加上安卓手機狀態欄基本上都能自定義,所以狀態欄的樣式是五花八門的,傳統方式很難實現這個需求。最終我們使用WTM+ML.NET快速搭建了一個AI圖片分類的平臺,這個平臺的功能包括:
- 可維護多種圖片識別的任務。雖然目前的需求只有狀態欄識別這一個,但是系統應該支持多種圖片任務。
- 每種任務可以自定義具體分類
- 每種任務可以指定不同的圖片預處理操作,比如狀態欄識別這個任務應該在訓練和識別之前對原始圖片進行裁剪,只判斷上方80像素高的區域。
- 提供後臺界面允許管理人員對數據進行標註
- 允許線上增量訓練
- 提供對外API介面,使其他系統可以使用該api來進行圖片識別的工作
- 其他通用模塊,如日誌,用戶,許可權等
以上的需求我們用了不到一個工作日,使用WTM+ML.NET就快速實現了,當然準備初次訓練所需的圖片用了兩周的時間。最終我們使用了七千多張帶狀態欄的圖片,和兩千多張不帶狀態欄的圖片訓練完成了這個模型,準確率可以達到95%。後續通過人工標註和增量訓練這個準確度還可以提高。
這個系統目前已經上線,為一個40萬日活的App提供圖片識別服務,表現相當穩定。
Talk is cheep, show me the code?
沒問題,歡迎來我們在CSDN上的課程 https://edu.csdn.net/course/detail/27568 , 或者在csdn里搜索WTM找到我們的視頻教程。裡面有完整的從0開始開發上述系統的視頻講解,並有完整的源代碼。 源碼不是公司的哦,公司用的Layui,我又用VUE重新寫了一遍。 用了WTM,這都不是事兒,快得很。