談談調用騰訊雲【OCR-通用印刷體識別】Api踩的坑

来源:http://www.cnblogs.com/liuyoung/archive/2017/12/25/8082563.html
-Advertisement-
Play Games

一、寫在前面 最近做項目需要用到識別圖片中文字的功能,本來用的Tesseract這個寫的,不過效果不是很理想。 隨後上網搜了一下OCR介面,就準備使用騰訊雲、百度的OCR介面試一下效果。不過這個騰訊雲OCR就折騰了一天! 二、OCR-通用印刷體識別 首先附上文檔地址:OCR-通用印刷體識別 有兩種調 ...


一、寫在前面

最近做項目需要用到識別圖片中文字的功能,本來用的Tesseract這個寫的,不過效果不是很理想。

隨後上網搜了一下OCR介面,就準備使用騰訊雲、百度的OCR介面試一下效果。不過這個騰訊雲OCR就折騰了一天!

二、OCR-通用印刷體識別

首先附上文檔地址:OCR-通用印刷體識別

有兩種調用方式:Url和本地圖片。

1、使用 url 的請求包

POST /ocr/general HTTP/1.1
Authorization: FCHXdPTEwMDAwMzc5Jms9QUtJRGVRZDBrRU1yM2J4ZjhRckJi==
Host: recognition.image.myqcloud.com
Content-Length: 187
Content-Type: application/json

{
  "appid":"123456",
  "bucket":"test",
  "url":"http://test-123456.image.myqcloud.com/test.jpg"
} 

看到這種格式,心裡大概有數了,開始敲代碼:

HttpClient client = new HttpClient();
var para = new
{
    appid = "123456",
    bucket = "test",
    url = "http://test-123456.image.myqcloud.com/test.jpg"
};
var jsonPara = JsonConvert.SerializeObject(para);
StringContent content = new StringContent(jsonPara);
content.Headers.ContentType = new MediaTypeHeaderValue("application/json");
content.Headers.ContentLength = jsonPara.Length;
content.Headers.Add("Host", "recognition.image.myqcloud.com");
content.Headers.Add("Authorization", aut);
var taskHrm = client.PostAsync(url, content);
taskHrm.Wait();
var taskStr = taskHrm.Result.Content.ReadAsStringAsync();
taskStr.Wait();
var result = taskStr.Result;

F5運行,結果報錯了:

  

Host和Authorization不能這樣添加到Headers中。於是乎我自作聰明的把它們放到參數中了:

var para = new
{
    appid = "123456",
    bucket = "test",
    url = "http://test-123456.image.myqcloud.com/test.jpg",
    Host = "recognition.image.myqcloud.com",
    Authorization = aut
};  

這樣運行代碼時沒有報錯,不過後臺返回“has no sign or sign is empty”,沒有簽名。

再回頭看看參數要求,Host和Authorization必須添加在請求包Header中。於是百度一下,如何使用Httpclient設置Authorization。最終解決方案如下:

client.DefaultRequestHeaders.Host = "recognition.image.myqcloud.com";
client.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Basic", aut); 

成功運行!

使用url的幾率畢竟少,項目中基本上都是上傳一張本地圖片,然後識別出來文字。

 2、使用 image 的請求包

POST /ocr/general HTTP/1.1
Authorization: FCHXdPTEwMDAwMzc5Jms9QUtJRGVRZDBrRU1yM2J4ZjhRckJi==
Host: recognition.image.myqcloud.com
Content-Length: 735
Content-Type: multipart/form-data;boundary=--------------acebdf13572468

----------------acebdf13572468
Content-Disposition: form-data; name="appid";

123456
----------------acebdf13572468
Content-Disposition: form-data; name="bucket";

test
----------------acebdf13572468
Content-Disposition: form-data; name="image"; filename="test.jpg"
Content-Type: image/jpeg

xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
----------------acebdf13572468--

說實話看到這種格式,一開始真是一臉懵逼,前面幾個參數還好,後面這一大串不知道怎麼傳遞過去,後來百度了一下,這種格式符合RFC 2045協議

具體解釋一下:

第5行:聲明Content Type類型,並定義邊界字元串。邊界符可以自定義,不過最好是用破折號等數據中一般不會出現的字元;

第6、9、13以及18行是換行,傳遞的時候使用‘\r\n';

第7、11以及15行是‘--’加上第5行的boundary即邊界字元串。這裡要註意是一定要加上前面的連字元‘--’,我開始沒註意寫的是和boundary一樣,結果一直報錯。

第8、10、12、14就是傳遞的Key_Value類型的數據。“appid”和“bucket”就是要傳遞的key,而“123456”以及“test”就是分別對應的value。

第16、17行代表另外一個數據,key是image,filename是“test.jpg”。

最後兩行就是結束了。註意最後一行是boundary加上‘--’。

弄清楚是什麼意思了,就可以開始寫代碼了。這裡我們用WebRequest,至於為什麼不用HttpClient,研究ing。不知哪位仁兄使用HttpClient寫過,請不吝賜教。

具體實現

HttpWebRequest webReq = (HttpWebRequest)WebRequest.Create(new Uri(url));
Stream memStream = new MemoryStream();
webReq.Method = "POST";
string boundary = "--------------" + DateTime.Now.Ticks.ToString("x");// 邊界符  
webReq.ContentType = "multipart/form-data; boundary=" + boundary;

接下來是一個換行符,對應第6行:

byte[] enter = Encoding.ASCII.GetBytes("\r\n");  //換行
memStream.Write(enter, 0, enter.Length);                      

傳遞key_value的時候格式都是一樣,於是我們寫在一個迴圈裡面:

Dictionary<string, string> dic = new Dictionary<string, string>()
{
    {"appid","1255710379"} ,
    {"bucket","test1"}
};
//寫入文本欄位
string inputPartHeaderFormat = "--" + boundary + "\r\n" + "Content-Disposition:form-data;name=\"{0}\";" + "\r\n\r\n{1}\r\n";
foreach (var kv in dic)
{
    string inputPartHeader = string.Format(inputPartHeaderFormat, kv.Key, kv.Value);
    var inputPartHeaderBytes = Encoding.ASCII.GetBytes(inputPartHeader);
    memStream.Write(inputPartHeaderBytes, 0, inputPartHeaderBytes.Length);
}

接著該寫入image了,這裡我們在bin/debug裡面有一張名為1.jpg的圖片:

var fileStream = new FileStream("1.jpg", FileMode.Open, FileAccess.Read);
// 寫入文件  
string imagePartHeader = "--" + boundary + "\r\n" +
                         "Content-Disposition: form-data; name=\"{0}\"; filename=\"{1}\"\r\n" +
                         "Content-Type: image/jpeg\r\n\r\n";
var header = string.Format(imagePartHeader, "image", "1.jpg");
var headerbytes = Encoding.UTF8.GetBytes(header);
memStream.Write(headerbytes, 0, headerbytes.Length);
var buffer = new byte[1024];
int bytesRead;
while ((bytesRead = fileStream.Read(buffer, 0, buffer.Length)) != 0)
{
    memStream.Write(buffer, 0, bytesRead);
}

最後就是結束符了:

 // 最後的結束符  
byte[] endBoundary = Encoding.ASCII.GetBytes("xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" + "\r\n" + boundary + "--\r\n");
memStream.Write(endBoundary, 0, endBoundary.Length);

接下來設置其他Header參數:

webReq.ContentLength = memStream.Length;
webReq.Headers.Add(HttpRequestHeader.Authorization, aut);
webReq.Host = "recognition.image.myqcloud.com";

這裡需要註意的一點是設置Host值的時候不能使用

webReq.Headers.Add(HttpRequestHeader.Host, "recognition.image.myqcloud.com");

這個方法,否則會有異常。 

var requestStream = webReq.GetRequestStream();
memStream.Position = 0;
memStream.CopyTo(requestStream);
HttpWebResponse response = (HttpWebResponse)webReq.GetResponse();
StreamReader sr = new StreamReader(response.GetResponseStream(), Encoding.UTF8);
var ret = sr.ReadToEnd();
sr.Close();
response.Close();
requestStream.Close();
memStream.Close();

完美運行!

 

3、計算Authorization授權簽名

簽名分為多次有效簽名和單次有效簽名。它們拼接成的簽名串格式為:

a=[appid]&b=[bucket]&k=[SecretID]&e=[expiredTime]&t=[currentTime]&r=[rand]&u=[userid]&f=[fileid]

具體每個欄位的含義請參見官方文檔:簽名和鑒權文檔

需要註意的有兩點:

1、使用 HMAC-SHA1 演算法對請求進行加密;

2、簽名串需要使用 Base64 編碼(首先對orignal使用HMAC-SHA1演算法進行簽名,然後將orignal附加到簽名結果的末尾,再進行Base64編碼,得到最終的sign。)。

 /// <summary>
 /// HMAC-SHA1加密演算法
 /// </summary>
 /// <param name="secret_key">密鑰</param>
 /// <param name="orignalStr">源文</param>
 /// <returns></returns>
 public static string HmacSha1Sign(string secret_key, string orignalStr)
 {
     var hmacsha1 = new HMACSHA1(Encoding.UTF8.GetBytes(secret_key));
     var orignalBytes = Encoding.UTF8.GetBytes(orignalStr);
     var hashBytes = hmacsha1.ComputeHash(orignalBytes);
     List<byte> bytes = new List<byte>();
     bytes.AddRange(hashBytes);
     bytes.AddRange(orignalBytes);
     return Convert.ToBase64String(bytes.ToArray());
 }

三、一些其他的註意點

文中使用的appid、bucket、secret_id、secret_key需要註冊萬象優圖後,才能得到。至於如何得到,文檔中說的很清楚,有詳細的步驟。

四、最後

希望你在調用騰訊雲-OCR通用印刷體識別Api的時候可以少走些彎路,少踩一些坑。當然了這些可能算不上坑,可能是個人一些基礎知識沒掌握。不管怎麼樣,如果你在使用OCR的時候,本文對你有一點幫助,那它就發揮了應有的作用。

本文的源代碼有興趣的可以下載

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • [1]修改hosts文件 [2]啟動apache虛擬主機功能 [3]修改vhosts配置文件 ...
  • 可選的<generator>子元素是 一個Java類的名稱,用來生成該持久化類實例的唯一標識符。如果這個生成器實例需要某些配置值或者初始化參數,可以使用<param>元素來傳遞這些參數。 所有的生成器都實現了org.hibernate.id.IdentifierGenerator介面。這是一個非常簡 ...
  • 一、簡介 Swagger的目標是為REST API定義一個與語言無關的標準介面,允許用戶發現和理解電腦服務的功能,而無需訪問源代碼。當通過Swagger正確定義時,用戶可以用最少量的實現邏輯理解遠程服務並與之交互。類似於低級編程所做的介面。 二、實現步驟 1、添加 Maven 依賴 2、Swagg ...
  • 緩存一致性協議給緩存行(通常為64位元組)定義了個狀態:獨占(exclusive)、共用(share)、修改(modified)、失效(invalid),用來描述該緩存行是否被多處理器共用、是否修改。所以緩存一致性協議也稱MESI。 ...
  • 相對於版本1.0,多了很多方法, 比如,獲取文件的尾碼名,或修改尾碼名和一些文件的簡單操作。 文件複製到文件,文件複製到路徑,路徑下文件複製到新路徑下, 代碼如下,請享用: 組合併且封裝了File的一些方法,文件路徑就是File對象。 上邊都是字元流,至於線程開啟字元流的的運算,加油,你可以的。 ...
  • 五分鐘輕鬆學會管理項目開發環境。 在開發Python應用程式的時候,系統安裝的Python3只有一個版本:3.x。所有第三方的包都會被pip安裝到Python3的site-packages目錄下。 pycharm安裝可以在設置里進行管理。 如果我們要同時開發多個應用程式,每個應用可能需要各自擁有一套 ...
  • 最近忽然要用到在VerilogHDL中調用VHDL的模塊,從網上找了常式,把自己會忘掉的東西記在這裡,。 2選1多路復用器的VHDL描述:entity mux2_1 is port( dina : in bit; dinb : in bit; sel : in bit; dout : out bit ...
  • 首先說明同步與非同步,阻塞與非阻塞的問題: Asynchronous vs. Synchronous A method call is considered synchronous if the caller cannot make progress until the method returns ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...