C# || 批量翻譯工具 || 百度翻譯api || 讀取.cs文件內容 || 正則表達式篩選文件

来源:https://www.cnblogs.com/BFMC/archive/2023/03/15/17217831.html
-Advertisement-
Play Games

背景: 我們項目一開始的所有提示都是中文,後來要做國際化。發現項目中的帶雙引號的中文居然有 2.3 w 多條!!!簡直讓人欲哭無淚... 如果使用人工改的話,首先不說正確率了。光是效率都是難難難。所以發揮了自己的才能寫了一個自動化工具。 思路: 首選讀取項目文件夾下的所有文件路徑 篩選路徑文件尾碼. ...


背景:

我們項目一開始的所有提示都是中文,後來要做國際化。發現項目中的帶雙引號的中文居然有 2.3 w 多條!!!簡直讓人欲哭無淚...

如果使用人工改的話,首先不說正確率了。光是效率都是難難難。所以發揮了自己的才能寫了一個自動化工具。

思路:

  1. 首選讀取項目文件夾下的所有文件路徑
  2. 篩選路徑文件尾碼.只對.cs或自定義的文件操作讀取
  3. 使用正則表達式進行查詢並處理為數組
  4. 調用免費的百度翻譯api進行任意類型的翻譯
  5. 使用replace進行替換字元串,並保存

準備工作:

1,百度智能雲領取免費的api介面

 

 

 

2,創建應用

 

 

3,調試api

 

 

 

代碼實現:

以上準備工作就緒後,代碼就比較容易實現了,完整控制台代碼如下:

Program.cs

 

using Batch_translation;
using System.Text.RegularExpressions;

Console.WriteLine("請按下任意鍵進行批量翻譯!");
Console.ReadLine();



string strFolderPath = "you FolderPath";//你的項目文件夾路徑
string[] files = Directory.GetFiles(strFolderPath, "*", SearchOption.AllDirectories); // 獲取文件夾下所有文件路徑,包括子文件夾
string[] subFolders = Directory.GetDirectories(strFolderPath, "*", SearchOption.AllDirectories); // 獲取所有子文件夾路徑

foreach (var filePath in files)
{
    //業務邏輯
    if (filePath.EndsWith(".cs"))
    {
        BatchTran(filePath);//獲取文件內容併進行轉換操作
    }
}
foreach (var folder in subFolders)
{
    foreach (var filePath in Directory.GetFiles(folder))
    {
        //業務邏輯
        if (filePath.EndsWith(".cs"))
        {
            BatchTran(filePath);//獲取文件內容併進行轉換操作
        }
    }
}

Console.WriteLine("轉化完成");




void BatchTran(string filePath)
{
    /* 核心邏輯:
    首選讀取項目文件夾下的所有文件路徑
    篩選路徑文件尾碼.只對.cs或自定義的文件操作讀取
    使用正則表達式進行查詢並處理為數組
    調用免費的百度翻譯api進行任意類型的翻譯
    使用replace進行替換字元串,並保存
     */

    BaiDuApi baiDuApi = new BaiDuApi("you apikey", "you secretKey");//百度api 初始化
    string content = File.ReadAllText(filePath);//讀取文本
    string pattern = @"("".*[\u4E00-\u9FA5]+.*[\u4E00-\u9FA5]+.*"")";//定義所需要的正則表達式(ps:此正則表示查詢英文雙引號下的中文)
    Regex myRegex = new Regex(pattern);
    MatchCollection collection = myRegex.Matches(content);
    foreach (Match match in collection)
    {
        var oldStr = "";
        oldStr = match.Value;//.Substring(0, match.Value.Length - 1)

        var newStr = baiDuApi.Translate(oldStr);
        if (!string.IsNullOrEmpty(newStr))
            content = content.Replace(oldStr, newStr);
    }
    if (collection.Count > 0)
        // 將修改後的內容寫入到文件中
        File.WriteAllText(filePath, content);
}

 

BaiDuApi.cs

using System;
using System.IO;
using Newtonsoft.Json;
using RestSharp;

namespace Batch_translation
{
    public class BaiDuApi
    {

        private readonly string apiKey;
        private readonly string secretKey;
        public BaiDuApi(string apiKey, string secretKey)
        {
            this.apiKey = apiKey;
            this.secretKey = secretKey;
        }

        public string Translate(string sourceText)
        {
            var token = GetAccessToken(apiKey, secretKey);
            if (token == "")
                return "";
            var client = new RestClient($"https://aip.baidubce.com/rpc/2.0/mt/texttrans/v1?access_token={token}");
            var request = new RestRequest("", Method.Post);
            request.AddHeader("Content-Type", "application/json");
            request.AddHeader("Accept", "application/json");

            // 定義一個匿名類型對象
            var data = new { from = "zh", to = "en", q = sourceText };
            // 將對象序列化成 JSON 字元串
            string body = JsonConvert.SerializeObject(data);
            request.AddParameter("application/json", body, ParameterType.RequestBody);
            var response = client.Execute(request);
            if (response.Content == null)
            {
                return "";
            }
            var dataResult = JsonConvert.DeserializeObject<BaiDuMode>(response.Content);
            if (dataResult.result != null)
            {
                if (dataResult.result.trans_result != null && dataResult.result.trans_result.Count > 0)
                {
                    return dataResult.result.trans_result[0].dst;
                }
            }
            return sourceText;
        }


        /**
        * 使用 AK,SK 生成鑒權簽名(Access Token)
        * @return 鑒權簽名信息(Access Token)
        */
        static string GetAccessToken(string API_KEY, string SECRET_KEY)
        {
            var client = new RestClient($"https://aip.baidubce.com/oauth/2.0/token");
            var request = new RestRequest("", Method.Post);
            request.AddParameter("grant_type", "client_credentials");
            request.AddParameter("client_id", API_KEY);
            request.AddParameter("client_secret", SECRET_KEY);
            var response = client.Execute(request);
            Console.WriteLine(response.Content);
            if (response.Content == null)
                return "";
            var result = JsonConvert.DeserializeObject<dynamic>(response.Content);
            return result.access_token.ToString();
        }


    }
}

結語:

在每次編碼中成長,提升自己的思想。這隻是一個很簡陋的代碼工具,如有好的建議也可以評論區討論。感謝觀看。

從前慢,車馬慢。 一生只愛一個人。
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • java介面學習筆記 1. 抽象類和抽象方法 抽象方法:abstract void f(); 抽象類:包含抽象方法的類稱為抽象類。如果一個方法包含一個或多個抽象方法,則該類必須被定義為抽象類,否則編譯器會產生錯誤消息。 示例: public abstract class Basic { abstra ...
  • Qt 學習筆記全系列傳送門: Qt 學習筆記 - 第一章 - 快速開始、信號與槽 Qt 學習筆記 - 第二章 - 添加圖片、佈局、界面切換 Qt 學習筆記 - 第三章 - Qt的三駕馬車之一 - 串口編程 + 程式打包成Windows軟體 Qt 學習筆記 - 第四章 - Qt的三駕馬車之二 - 網路 ...
  • 讀寫Excel基本代碼 直接複製不一定能用 實體類 @ExcelIgnore 在導出操作中不會被導出 @ExcelProperty 在導入過程中 可以根據導入模板自動匹配欄位, 在導出過程中可用於設置導出的標題名字 @Getter @Setter public class Material{ @Ex ...
  • TypeScript 備忘清單 IT寶庫TypeScript開發速查清單包含最重要基礎、泛型、方法、class 等 TypeScript 強類型編程語言語法的快速參考備忘單。初學者的完整快速參考入門,為開發人員分享快速參考備忘單。 開發速查表大綱 入門 Interface 介紹 內置類型基元 常見的 ...
  • Qt 學習筆記全系列傳送門: Qt 學習筆記 - 第一章 - 快速開始、信號與槽 Qt 學習筆記 - 第二章 - 添加圖片、佈局、界面切換 Qt 學習筆記 - 第三章 - Qt的三駕馬車之一 - 串口編程 + 程式打包成Windows軟體 【本章】Qt 學習筆記 - 第四章 - Qt的三駕馬車之二 ...
  • 背景 日常開發中,經常需要對一些響應不是很快的關鍵業務介面增加防重功能,即短時間內收到的多個相同的請求,只處理一個,其餘不處理,避免產生臟數據。這和冪等性(idempotency)稍微有點區別,冪等性要求的是對重覆請求有相同的效果和結果,通常需要在介面內部執行業務操作前檢查狀態;而防重可以認為是一個 ...
  • 預覽 技術實現 看過我上篇在 WPF 中實現 OpenGL 與 D3D 渲染的同學應該知道,我是依靠 WGL 中 WGL_NV_DX_interop 擴展與 D3D Surface 關聯併在使用該 Surface 實現渲染。 所以我們這次實現也是如此,但與 WPF 不同的是 WinUI 支持 D3D ...
  • 需求 swagger頁面按標簽Tags分組顯示。 沒有打標簽Tags的介面,預設歸到"未分組"。 分組內按介面路徑排序 說明 為什麼沒有使用GroupName對介面進行分組? 暫時不需要,以及不想點擊swagger頁面右上角那個下拉框。 當然Tags和GroupName不衝突,不影響通過GroupN ...
一周排行
    -Advertisement-
    Play Games
  • .NET Core 選項系統的主要實現在 Microsoft.Extensions.Options 和 Microsoft.Extensions.Options.ConfigurationExtensions 兩個 Nuget 包。對於一個框架的源碼進行解讀,我們可以從我們常用的框架中的類或方法入手 ...
  • 最近在工作中遇到一個問題,就是我有多個線程會調用bitmap對象,運行的時候報錯,對象當前正在其他地方使用。第一反應肯定是加鎖啊,於是我就在每個用到bitmap的地方都加了鎖,但是運行之後依然報這個錯 測試代碼如下 using System; using System.Drawing; using ...
  • 一:背景 1. 講故事 前段時間有位朋友微信找到我,說他的程式使用 hsl 庫之後,採集 plc 時記憶體溢出,讓我幫忙看一下怎麼回事,哈哈,貌似是分析之旅中的第二次和 hsl 打交道,既然找到我,那就上 windbg 說話吧。 二:WinDbg 分析 1. 為什麼會記憶體溢出 簡單觀察程式的提交記憶體之 ...
  • 在 IIS 上啟用 Websocket 在 Windows Server 2012 或更高版本上啟用對 WebSocket 協議的支持: 備註 使用 IIS Express 時無需執行這些步驟 通過“管理”菜單或“伺服器管理器”中的鏈接使用“添加角色和功能”嚮導。 選擇“基於角色或基於功能的安裝”。 ...
  • C#-垃圾回收機制(GC) 什麼是GC 官網中有這麼一句話: The garbage collector is a common language runtime component that controls the allocation and release of managed memory ...
  • 呆了2個大屏行業的公司,對大屏幕有一些瞭解,所以整理下所瞭解的觸摸屏相關概念。方便自己以及進入這個行業的小伙伴們,能有個系統、快速的認知。 觸摸屏詳細的知識點,網上其實都有。整理資料過程中,我也瞭解了更多的觸摸屏知識,像聲波屏、光學屏之類的之前就沒接觸。下麵分不同的模塊,給大家介紹 交互觸摸屏類型 ...
  • 近段時間忙於各種項目和對【易排平臺】的優化,沒顧得上分享APS相關的小技巧,回頭看看小公眾號的關註人數早已達1500+,在此爭取時間寫一下這段時間在項目上及平臺優化過程中遇到的一些小技巧,以感謝諸位的關註。過去數月的解決的問題中,涉及最多的是規劃模型中,實現各種時間維度的功能,目前在平臺上也稍有成果 ...
  • 針對大量log日誌快速定位錯誤地方 動態查看日誌 tail -f catalina.ou 從頭打開日誌文件 cat catalina.ou 可以使用 >nanjiangtest.txt 輸出某個新日誌去查看 [[email protected] logs]# cat -n catalina.out |grep 7 ...
  • 前言 RocketMQ是阿裡巴巴旗下一款開源的MQ框架,經歷過雙十一考驗、Java編程語言實現,有非常好完整生態系統。RocketMQ作為一款純java、分散式、隊列模型的開源消息中間件,支持事務消息、順序消息、批量消息、定時消息、消息回溯等 本篇文章第一部分屬於一些核心概念和工作流程的講解;第二部 ...
  • 在java,c#類的成員修飾符包括,公有、私有、程式集可用的、受保護的。 對於python來說,只有兩個成員修飾符:公有成員,私有成員 成員修飾符是來修飾誰呢?當然是修飾成員了。那麼python類的成員包括什麼呢? python成員: 欄位,方法,屬性 每個類成員的修飾符有兩種: 公有成員:內部外部 ...