php抓取百度快照、百度收錄、百度熱詞程式代碼

来源:http://www.cnblogs.com/shouce/archive/2016/03/08/5252675.html
-Advertisement-
Play Games

<?/*抓取百度收錄代碼*/function baidu($s){ $baidu="http://www.baidu.com/s?wd=site%3A".$s; $site=file_get_contents($baidu); //$site=iconv("gb2312", "UTF-8", $si


複製代碼
<?
/*
抓取百度收錄代碼
*/
function baidu($s){
$baidu="http://www.baidu.com/s?wd=site%3A".$s;
$site=file_get_contents($baidu);
//$site=iconv("gb2312", "UTF-8", $site);
ereg("找到相關網頁(.*)篇,", $site,$count);
$count=str_replace("找到相關網頁","",$count);
$count=str_replace("篇,","",$count);
$count=str_replace("約","",$count);
$count=str_replace(",","",$count);
return $count[0];
}

echo baidu(www.hzhuti.com); //獲取好主題在百度中的收錄數量

?>
複製代碼



 

獲取百度的熱詞

複製代碼
<?php 
/**
* * @user 小傑
* @return array 返回百度的熱詞數據(數組返回)
*/
function getBaiduHotKeyWord()
{
$templateRss = file_get_contents('http://top.baidu.com/rss_xml.php?p=top10');
If (preg_match('/<table>(.*)</table>/is', $templateRss, $_description)) {
$templateRss = $_description [0];
$templateRss = str_replace("&", "&", $templateRss);
}
$templateRss = "<?xml version="1.0" encoding="GBK"?>" . $templateRss;
$xml = simplexml_load_String($templateRss);
foreach ($xml->tbody->tr as $temp) {
if (!empty ($temp->td->a)) {
$keyArray [] = trim(($temp->td->a));
}
}
return $keyArray;
}
print_r(getBaiduHotKeyWord());
複製代碼


 


這是在網上找的 稍微修改了下 將下麵代碼寫入php文件
百度收錄和百度快照時間

複製代碼
<?php
$domain = “http://www.hzhuti.com/nokia/5230/ *欲查詢的功能變數名稱*/
$site_url = ‘http://www.baidu.com/s?wd=site%3A’;
$all = $site_url.$domain; /*功能變數名稱所有收錄的網址*/
$today = $all.’&lm=1′; /*功能變數名稱今日收錄的網址*/
$utf_pattern = “/找到相關結果數(.*)個/”;
$kz_pattern = “/<span class=”g”>(.*)</span>/”; /*用以匹配快照日期的字元串*/
$times = “/d{4}-d{1,2}-d{1,2}/”; /*匹配快照日期的正則表達式,如:2011-8-4*/
$s0 = @file_get_contents($all); /*將site:www.ninthday.net的網頁置入$s0字元串中*/
$s1 = @file_get_contents($today);
preg_match($utf_pattern,$s0,$all_num); /*匹配”找到相關結果數*個”*/
preg_match($utf_pattern,$s1,$today_num);
preg_match($kz_pattern,$s0,$temp);
preg_match($times,$temp[0],$screenshot);
if($all_num[1] == “”)
$all_num[1] = 0;
if($today_num[1] == “”)
$today_num[1] = 0;
if($screenshot[0] == “”)
$screenshot[0] = “暫無快照”;
?>
<html>
<head>
<title>Test</title>
</head>
<body>
<table>
<tr>
<td>日期</td><td>百度收錄</td><td>百度今日收錄</td><td>百度快照日期</td>
</tr>
<tr>
<td><?php echo date(‘m月d日G時’);?> </td><td><?php echo $all_num[1]; ?></td><td><?php echo $today_num[1]; ?></td><td><?php echo $screenshot[0]; ?></td>
</tr>

</table>
<p>百度收錄:<a href=”<?php echo $all; ?>” target=”_blank”><?php echo $all_num[1]; ?></a></p>
<p>百度今日收錄:<a href=”<?php echo $today; ?>” target=”_blank”><?php echo $today_num[1]; ?></a></p>
<p>百度快照日期:<a href=”<?php echo $all; ?>”><?php echo $screenshot[0]; ?></a></p>
</body>
</html>
複製代碼



 

上面的方法未經過嚴格考慮,如果伺服器不支持file_get_contents函數我們就無法操作了,所以還可以利用curl操作,這個更方便可以模仿用戶哦。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 轉載地址:http://www.cnblogs.com/yangmingming/archive/2010/02/03/1662546.html 一:Ildasm.exe簡介 這一微軟VS自帶工具,在上一篇博文《初識Ildasm.exe——IL反編譯的實用工具》中已經做了詳細介紹,這裡不再鰲述; 二
  • 轉載地址http://www.cnblogs.com/yangmingming/archive/2010/02/03/1662307.html Ildasm.exe 概要:(路徑:C:\Program Files (x86)\Microsoft SDKs\Windows\v數字.0\bin) 一.前
  • 前言 關於混合C 和C++的編程方式,本人之前寫過一篇博客(參見 "混合語言編程:C 使用原生的Directx和OpenGL" ),在之前的博客中,介紹了在C 的Winform和WPF下使用原生的Direct和OpenGL進行繪圖,主要使用的方式是聲明一個函數為導出函數,然後就可以在C 中使用這個函
  • 在我前面很多關於Visio的開發過程中,介紹了各種Visio的C#開發應用場景,包括對Visio的文檔、模具文檔、形狀、屬性數據、各種事件等相關的基礎處理,以及Visio本身的整體項目應用,雖然時間過去很久,不過這些技術依舊還在使用中,最近應客戶培訓的需要,我對所有的內容進行了重新整理,把一些沒有介...
  • 委托是一種存儲函數引用的類型,在事件和事件的處理時有重要的用途 通俗的說,委托是一個可以引用方法的類型,當創建一個委托,也就創建一個引用方法的變數,進而就可以調用那個方法,即委托可以調用它所指的方法。 使用委托 委托的使用需要以下步驟: 定義委托 delegate double ParocessDe
  • 解決WPF Viewport3D透視模式時窗體模糊。
  • 最近做項目中往雲端伺服器上傳資源包文件的時候用到了Socket的通訊,便想把我是如何運用的和大家一起分享!這也是我的第一篇技術分享,哈哈,希望大家多多指點,我這裡只是客戶端的操作,所以只貼客戶端的代碼:
  • 當垂直應用越來越多,應用之間交互不可避免,將核心業務抽取出來,作為獨立的服務,逐漸形成穩定的服務中心,當前服務支持thrift服務框架。支持服務的註冊發現,服務調用的負載均衡,服務調用的監控。
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...