C#實現谷歌翻譯API

来源:http://www.cnblogs.com/marso/archive/2017/06/07/google_translate_api.html
-Advertisement-
Play Games

由於谷歌翻譯官方API是付費版本,本著免費和開源的精神,分享一下用C#實現谷歌翻譯API的代碼。這個代碼非常簡單,主要分兩塊:通過WebRequest的方式請求內容;獲取Get方式的請求參數(難點在於tk的獲取)。 一、WebRequest代碼 二、谷歌翻譯介面的實現 1、抓包查看翻譯網路請求,這裡 ...


  由於谷歌翻譯官方API是付費版本,本著免費和開源的精神,分享一下用C#實現谷歌翻譯API的代碼。這個代碼非常簡單,主要分兩塊:通過WebRequest的方式請求內容;獲取Get方式的請求參數(難點在於tk的獲取)。

一、WebRequest代碼

var webRequest = WebRequest.Create(url) as HttpWebRequest;

webRequest.Method = "GET";

webRequest.CookieContainer = cookie;

webRequest.Referer = referer;

webRequest.Timeout = 20000;

webRequest.Headers.Add("X-Requested-With:XMLHttpRequest");

webRequest.Accept = "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8";

webRequest.UserAgent = useragent;

  using (var webResponse = (HttpWebResponse)webRequest.GetResponse())
  {
   using (var reader = new StreamReader(webResponse.GetResponseStream(), Encoding.UTF8))
   {

    html = reader.ReadToEnd();
    reader.Close();
    webResponse.Close();
   }
  }

  

二、谷歌翻譯介面的實現

  1、抓包查看翻譯網路請求,這裡是用谷歌瀏覽器查看的網路請求,如下圖:

 

 

   可以看到,請求方式是“Get”方式,後面跟的請求參數很多,如下圖:

  其中,最重要的參數有:sl--來源語言,一般設置為auto即自動檢測,tl--目標語言,你想翻譯成的語言,tk--ticket即使發車車票,谷歌就靠這個來防止我們免費調用的,這是本API最難的地方。

  2、tk的獲取

  在打開https://translate.google.com/頁面是,獲取到的HTML代碼中有如下一個生成TKK的腳本:

 

  直接運行這個腳本,可以生成一個字元串:

  從監控的網路中可以發現其中一個JS調用了這個TKK值,這個JS加了密進行混淆的,要破解這個JS需要扎實的基本功,以及足夠的耐心,我也是網上找的別人破解的JS代碼,親測可用,需將此代碼保存在gettk.js文檔中,方便調用:

var b = function (a, b) {
    for (var d = 0; d < b.length - 2; d += 3) {
        var c = b.charAt(d + 2),
            c = "a" <= c ? c.charCodeAt(0) - 87 : Number(c),
            c = "+" == b.charAt(d + 1) ? a >>> c : a << c;
        a = "+" == b.charAt(d) ? a + c & 4294967295 : a ^ c
    }
    return a
}

var tk =  function (a,TKK) {
    for (var e = TKK.split("."), h = Number(e[0]) || 0, g = [], d = 0, f = 0; f < a.length; f++) {
        var c = a.charCodeAt(f);
        128 > c ? g[d++] = c : (2048 > c ? g[d++] = c >> 6 | 192 : (55296 == (c & 64512) && f + 1 < a.length && 56320 == (a.charCodeAt(f + 1) & 64512) ? (c = 65536 + ((c & 1023) << 10) + (a.charCodeAt(++f) & 1023), g[d++] = c >> 18 | 240, g[d++] = c >> 12 & 63 | 128) : g[d++] = c >> 12 | 224, g[d++] = c >> 6 & 63 | 128), g[d++] = c & 63 | 128)
    }
    a = h;
    for (d = 0; d < g.length; d++) a += g[d], a = b(a, "+-a^+6");
    a = b(a, "+-3^+b+-f");
    a ^= Number(e[1]) || 0;
    0 > a && (a = (a & 2147483647) + 2147483648);
    a %= 1E6;
    return a.toString() + "." + (a ^ h)
}

  

  要得到tk只需要,運行tk這個函數,它有兩個輸入值:a為翻譯文本內容,TKK是上文正則匹配得到的JS字元串執行的結果值。為方便在C#中執行JS,封裝了一個能執行JS的函數,如下:

        /// <summary>
        /// 執行JS
        /// </summary>
        /// <param name="sExpression">參數體</param>
        /// <param name="sCode">JavaScript代碼的字元串</param>
        /// <returns></returns>
        private string ExecuteScript(string sExpression, string sCode)
        {
            MSScriptControl.ScriptControl scriptControl = new MSScriptControl.ScriptControl();
            scriptControl.UseSafeSubset = true;
            scriptControl.Language = "JScript";
            scriptControl.AddCode(sCode);
            try
            {
                string str = scriptControl.Eval(sExpression).ToString();
                return str;
            }
            catch (Exception ex)
            {
                string str = ex.Message;
            }
            return null;
        }      

  

  3、實現翻譯的完整代碼

/// <summary>
/// 谷歌翻譯
/// </summary>
/// <param name="text">待翻譯文本</param>
/// <param name="fromLanguage">自動檢測:auto</param>
/// <param name="toLanguage">中文:zh-CN,英文:en</param>
/// <returns>翻譯後文本</returns>
public string GoogleTranslate(string text, string fromLanguage, string toLanguage)
{
    CookieContainer cc = new CookieContainer();

    string GoogleTransBaseUrl = "https://translate.google.com/";

    var BaseResultHtml = GetResultHtml(GoogleTransBaseUrl, cc, "");

    Regex re = new Regex(@"(?<=TKK=)(.*?)(?=\);)");

    var TKKStr = re.Match(BaseResultHtml).ToString() + ")";//在返回的HTML中正則匹配TKK的JS代碼

    var TKK = ExecuteScript(TKKStr, TKKStr);//執行TKK代碼,得到TKK值

    var GetTkkJS = File.ReadAllText("./gettk.js");

    var tk = ExecuteScript("tk(\""+text+"\",\""+TKK+"\")", GetTkkJS);

    string googleTransUrl = "https://translate.google.com/translate_a/single?client=t&sl="+fromLanguage+"&tl="+toLanguage+"&hl=en&dt=at&dt=bd&dt=ex&dt=ld&dt=md&dt=qca&dt=rw&dt=rm&dt=ss&dt=t&ie=UTF-8&oe=UTF-8&otf=1&ssel=0&tsel=0&kc=1&tk="+tk+"&q="+HttpUtility.UrlEncode(text);

    var ResultHtml = GetResultHtml(googleTransUrl, cc, "https://translate.google.com/");

    dynamic TempResult = Newtonsoft.Json.JsonConvert.DeserializeObject(ResultHtml);

    string ResultText = Convert.ToString(TempResult[0][0][0]);

    return ResultText;
}

public string GetResultHtml(string url,CookieContainer cc,string refer)
{
    var html="";
    
    var webRequest = WebRequest.Create(url) as HttpWebRequest;

    webRequest.Method = "GET";

    webRequest.CookieContainer = cookie;

    webRequest.Referer = referer;

    webRequest.Timeout = 20000;

    webRequest.Headers.Add("X-Requested-With:XMLHttpRequest");

    webRequest.Accept = "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8";

    webRequest.UserAgent = useragent;

    using (var webResponse = (HttpWebResponse)webRequest.GetResponse())
    {
       using (var reader = new StreamReader(webResponse.GetResponseStream(), Encoding.UTF8))
       {

        html = reader.ReadToEnd();
        reader.Close();
        webResponse.Close();
       }
    }
    return html;
}

/// <summary>
/// 執行JS
/// </summary>
/// <param name="sExpression">參數體</param>
/// <param name="sCode">JavaScript代碼的字元串</param>
/// <returns></returns>
private string ExecuteScript(string sExpression, string sCode)
{
    MSScriptControl.ScriptControl scriptControl = new MSScriptControl.ScriptControl();
    scriptControl.UseSafeSubset = true;
    scriptControl.Language = "JScript";
    scriptControl.AddCode(sCode);
    try
    {
        string str = scriptControl.Eval(sExpression).ToString();
        return str;
    }
    catch (Exception ex)
    {
        string str = ex.Message;
    }
    return null;
}  

  

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 下麵簡單介紹一下如何在Red Hat Enterprise Linux上一步一步創建一個SQL Server AG(Always On Availability Group),以及配置過程中遇到的坑的填充方法。 之前發表過一篇類似的文章是Configure Always On Availabilit ...
  • 中間實在忙啊,隔了幾天,終於有點時間,本來以為寫博客很簡單,不過現在感覺怎麼把意思表達清楚真是件難事啊,所以,寫的不好,園友們不要介意啊。 話說,上回我打算開發游戲,考慮了4種技術,後來我發現無論哪種技術應該是都能實現,區別大概就是性能以及占用的資源吧,所以,我後來實現用的是wpf。當時在網上搜索了 ...
  • 一. es安裝相關1.elasticsearch安裝 運行http://localhost:9200/2.head插件3.bigdesk插件安裝(安裝細節百度:windows elasticsearch 安裝,有詳細內容) 二. es插件相關http://www.searchtech.pro/ela ...
  • 環境:界面上有TextBox,ComboBox等控制項。 不建議把左右方向鍵都用來切換焦點,否則你在TextBox裡面改變游標所在字元位置就不方便了。 方法一:笨方法,需為每個控制項單獨註冊事件處理 以TextBox為例,代碼如下: 方法二:通用方法,無需為每個控制項單獨註冊事件處理,僅需在窗體類上加入如 ...
  • 凡是契約類或者繼承了契約類的類,如果想要屬性參與序列化與反序列化,需要在屬性上加上標記:DataMember ...
  • 最近幫朋友做個項目中遇到了type=file change事件只能執行一次的問題,度娘了一下,發現提供了各種解決方案,所以決定記錄一下我的思考方向和最終解決方式。 起初幫朋友做個項目,項目中遇到上傳文件,沒想太多,代碼就敲了起來,尼瑪,上傳做好啦,興衝衝,一測,ei,怎麼回事,怎麼不能上傳了,程式員 ...
  • 只要JSON字元串是一個對象,當我們直接反序列化遇到,字元串中的部分屬性值不符合要求時,我們可以先將對象轉為:JObject,對對象屬性修正後,再使用JObject提供的ToObject ...
  • 因為項目需要在導出數據到EXECL文檔的同時還需要導出圖片進去,在處理是遇到的一些問題,在此記錄一下。 首先代碼寫好之後放測試伺服器上去執行的時候報錯了,報檢索 COM 類工廠中 CLSID 為 {00024500-0000-0000-C000-000000000046} 的組件時失敗,原因是出現以 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...