[4]xlongwei工具類

来源:http://www.cnblogs.com/warcraft/archive/2016/11/09/6043269.html
-Advertisement-
Play Games

百度API:xlongwei 這個人提供的介面很多啊,也很實用:Word轉Html、Word轉Pdf、屬性配置、手機號段、微信公眾號消息加密、微信公眾號消息解密、二維碼、關鍵詞、分詞、拼音、生僻字、微博短鏈接。但是很多都不感興趣的,除了一個,那就是中文分詞啊。以前某天突然對瀏覽器以及編輯器中的滑鼠雙 ...


百度API:xlongwei

這個人提供的介面很多啊,也很實用:Word轉Html、Word轉Pdf、屬性配置、手機號段、微信公眾號消息加密、微信公眾號消息解密、二維碼、關鍵詞、分詞、拼音、生僻字、微博短鏈接。但是很多都不感興趣的,除了一個,那就是中文分詞啊。以前某天突然對瀏覽器以及編輯器中的滑鼠雙擊事件直接選中片語或者一段數字很好奇。然後問群裡人,群里說是中文分詞,之後看書(應該是《暗時間》)也無意看到。還扯出了開始思考好多巧合不是巧合的未解決的心理問題。雖然現在的知識以及技術對自然語言還無法處理,但是用介面感受一下還是不算過分吧。

1.Word轉Html、Word轉Pdf 

 

【選擇Word文檔】觸發file類型的input的click事件(代碼裡面用了jquery,也可以直接用js寫這塊就不用引入jq文件了)。然後點轉換,執行上傳+轉換。最後的鏈接就是本伺服器存儲的來自API的處理文件 

 1 <html>
 2     <head><meta charset="utf-8">
 3         <script type="text/javascript" src="./js/jquery-1.8.2.min.js"></script>
 4         <script type="text/javascript">
 5             $(function(){
 6                $('#wordx').click(function(){
 7                    $('#file').click();
 8                });
 9             });
10         </script>
11     </head>
12     <body>
13         <form action="" method="post" enctype="multipart/form-data">
14         <input type="file" name="file" id="file" style="display:none"/>
15         <input type="button" id="wordx" value="選擇Word文檔">
16         <br />
17         <input type="submit" name="submit" value="WORD轉Html" />
18         </form>
19     </body>
20 
21 </html>
22 <?php
23     $maxSize=5*1024*1024;//5M
24     if(!isset($_FILES["file"]["error"])){
25         exit;
26     }
27     if($_FILES["file"]["error"] > 0){
28         echo "Error: " . $_FILES["file"]["error"] . "<br />";
29         exit;
30     }else{
31        /* echo "Upload: " . $_FILES["file"]["name"] . "<br />";
32         //echo "Type: " . $_FILES["file"]["type"] . "<br />";
33         echo "Stored in: " . $_FILES["file"]["tmp_name"].'<br/>';
34         echo "Size: " . ($_FILES["file"]["size"] / 1024) . " Kb<br />";*/
35 
36         $suffix=substr(strrchr($_FILES["file"]["name"], '.'), 1);
37         if($suffix!='doc' && $suffix!='docx'){
38             echo '只允許doc和docx格式word文件';
39             exit;
40         }
41         if($_FILES["file"]["size"]>$maxSize){
42             echo '大於'.$maxSize/(1024*1024).'Mb';
43             exit;
44         }
45 
46         $name=date('YmdHis',time()).rand(1000,10000).'.'.$suffix;//拼接文件名
47         if (file_exists("upload/" . $name)){
48             echo $_FILES["file"]["name"] . " already exists. ";
49             exit;
50         }else{
51             $domain=$_SERVER['SERVER_NAME'];
52             $status=move_uploaded_file($_FILES["file"]["tmp_name"],"upload/" . $name);
53             //echo "Stored in: " . "upload/" . $name;
54             $url="http://{$domain}/api/upload/{$name}";
55             if ( (!file_exists ("upload/{$name}")) || !$status){
56                 echo '上傳失敗';
57                 exit;
58             }else{
59                 //echo "<a href='{$url}'>上傳成功</a><br/>";
60                 //echo "上傳成功<br/>";
61             }
62 
63             //Word轉Html
64             
65             $ch = curl_init();
66             $url = 'http://apis.baidu.com/xlongwei/open/doc2html?url='.$url;
67             $header = array(
68                 'apikey:百度API密鑰',
69             );
70             curl_setopt($ch, CURLOPT_HTTPHEADER  , $header);
71             curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
72             // 執行HTTP請求
73             curl_setopt($ch , CURLOPT_URL , $url);
74             $res = curl_exec($ch);
75             $data=json_decode($res,true);
76             //var_dump($data);
77             $htmlurl=NULL;
78             if(isset($data['domain'])&&isset($data['path'])){
79                 $htmlurl=$data['domain'].$data['path'];
80                 $name=$name=date('YmdHis',time()).rand(1000,10000).'.html';
81                 $status=copy($htmlurl,"html/" . $name);//網路鏈接的文件不能用move_uploaded_file,用了copy可以
82                 if($status){
83                     $htmlurl="http://{$domain}/api/html/{$name}";
84                 }else{
85                     //echo '挪動出錯';
86                     //exit;
87                 }
88                 echo "<a href='$htmlurl'>Html轉換完成</a>";
89 
90             }else{
91                 echo '伺服器錯誤,請重試。';
92                 exit;
93             }
94         }
95     }
96 ?>
Word轉Html完整代碼

 Pdf類似,只是介面處有不同。感覺效果還蠻好的嘛。肯定了,又不是相反的介面。

2.二維碼

我的神器海螺呢,還想問問二維碼什麼原理呢。

3.中文分詞

Ansj中文分詞 這是一個ictclas的java實現.

好棒,這分詞。之後順便把拼音也嵌入到分詞中去。

其中單字有多音字就會有好幾個音,比如這個吃(chi ji)、吐(tu3 tu4),所以判斷存不存在header(header 是拼音的首拼)然後空格分割取第一個(因為看到第一個大多數比較準確且自己也分辨不出第幾個是最好的啊)就OK。

挑一個BUG:不了了之 bulelezhi,為什麼不加成語字典呢。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ...
  • 上一篇中,描述瞭如何使用Spring隱式的創建bean,但當我們需要引進第三方類庫添加到我們的邏輯上時,@Conponent與@Autowired是無法添加到類上的,這時,自動裝配便不適用了,我們需要利用Java代碼來顯式實現bean。 @Autowired只表明在調用構造器時Spring為其註入一 ...
  • 1.什麼是Spring MVC? Spring MVC屬於SpringFrameWork的後續產品,它提供了構建 Web 應用程式的全功能 MVC 模塊,與Struts2一樣是一種優秀MVC框架,不同的是自Spring2.5引入了註解式controller及Spring 3以後的不斷完善,使得採用S ...
  • Struts2的處理結果(三) ——動態配置結果 1.使用表達式語法 示例: 現有test_success.action請求,符合test_*的格式,匹配的方法為success()方法,其邏輯視圖映射的物理視圖資源為success.jsp。 2.由Action的屬性值確定物理視圖資源 通過使用${屬 ...
  • Struts2的處理結果(二) ——處理結果的類型 1.Struts2內建的支持的結果類型: 在<result>元素中的type屬性,確定了結果類型。 chain:Action鏈式處理的結果類型; dispatcher:指定使用JSP為視圖資源的結果類型; freemarker:用於指定使用Free ...
  • abs(x) 返回數字的絕對值,如abs(-10) 返回 10 ceil(x) 返回數字的上入整數,如math.ceil(4.1) 返回 5 cmp(x, y) 如果 x < y 返回 -1, 如果 x == y 返回 0, 如果 x > y 返回 1 exp(x) 返回e的x次冪(ex),如mat ...
  • 你沒有錯,現在的瀏覽器都不怎麼支持實體引用了,這是個無奈的現實。我記得上回試過,好像如果DTD不是單獨的文件而是內置到XML裡面的話,實體還可以顯示的。你可以試一下 ...
  • ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...