百度Sitemap生成器

来源:https://www.cnblogs.com/jackrebel/archive/2019/11/15/11868057.html
-Advertisement-
Play Games

今天用了兩個小時, 為無限影視(https://www.88tv.org)開發了一個小工具, 用來生成baidu的sitemap。 方便用。 因為該電影站的視頻內容詳情網頁的ID是自增長的,所以可以按順序快速生成。 不用再寫爬蟲去一個一個鏈接爬了。 1. 輸入URL模板, 註意{*}, 這個是用來放 ...


 今天用了兩個小時, 為無限影視https://www.88tv.org)開發了一個小工具, 用來生成baidu的sitemap。  方便用。 

因為該電影站的視頻內容詳情網頁的ID是自增長的,所以可以按順序快速生成。 不用再寫爬蟲去一個一個鏈接爬了。 

1.  輸入URL模板, 註意{*}, 這個是用來放ID的。 

2.  ID區間,要生成多少到多少的頁面鏈接。

3.  排除ID: 排除這些ID。 

4.  更新時間, 這是sitemap中的結構, 一般指該頁面的更新時間。  頻繁度=更新頻繁度, 

5.  這工具加入了其它內容, 方便整理視頻欄目, 首頁及其它頁面的內容。 

 

 

 

這個工具不用讀資料庫, 不用爬網站, 只要你的網站內容ID有規律就能用。 

示例附件下載在末尾。 

 

預覽圖:

 

 

事件代碼:

            Common.PageInfo pg;
            if (cbChangefreq.Text == "")
            {
                MessageBox.Show("沒有選擇更新頻率.");
                return;
            }

            List<Common.PageInfo> list = new List<Common.PageInfo>();
            for (int i = (int)NuDMin.Value; i < NudMax.Value; i++)
            {
                if (((System.Collections.IList)rbtPC.Text.Split(',')).Contains(i.ToString()))
                {
                    continue;
                }
                pg = new Common.PageInfo();
                pg.loc = txtUrl.Text.Trim().Replace("{*}", i.ToString());
                pg.lastmod = txtUpdateDate.Text;
                pg.priority = nudPriority.Value.ToString();
                pg.changefreq = cbChangefreq.SelectedItem.ToString();
                list.Add(pg);
            }
            siteMap.url = list;
            string mySitemapStr = siteMap.GenerateSiteMapString(Application.StartupPath + "\\" + txtTemplate.Text.Trim());
            rtbTxt.Text = mySitemapStr;

 

 

輔助類:

using System;
using System.Collections.Generic;
using System.Text;

namespace Common
{

    using System;
    using System.Collections.Generic;
    using System.IO;
    using System.Linq;
    using System.Text;

    /// <summary>
    /// 生成站點地圖sitemap 
    /// </summary>
    public class SiteMap
    {
        public List<PageInfo> url
        {
            get;
            set;
        }

        /// <summary>
        /// 生成SiteMap字元串
        /// </summary>
        /// <returns></returns>
        public string GenerateSiteMapString(string file = "")
        {
            StringBuilder sb = new StringBuilder();
            sb.AppendLine("<?xml version=\"1.0\" encoding=\"UTF-8\"?>");
            sb.AppendLine("<urlset>");

            string text = "";
            #region MyRegion
            if (!string.IsNullOrWhiteSpace(file))
            {
                text = System.IO.File.ReadAllText(file);
            }
            sb.AppendLine(text);
            #endregion

            foreach (PageInfo pi in url)
            {
                sb.AppendLine("<url>");
                sb.AppendLine(string.Format("<loc>{0}</loc>", pi.loc));
                sb.AppendLine(string.Format("<lastmod>{0}</lastmod>", pi.lastmod));
                sb.AppendLine(string.Format("<changefreq>{0}</changefreq>", pi.changefreq));
                sb.AppendLine(string.Format("<priority>{0}</priority>", pi.priority));
                sb.AppendLine("</url>");
            }

            sb.AppendLine("</urlset>");
            return sb.ToString();
        }

        /// <summary>
        /// 保存Site文件
        /// </summary>
        /// <param name="FilePath">路徑</param>
        public void SaveSiteMap(string FilePath, string content)
        {
            using (StreamWriter m_streamWriter = new StreamWriter(FilePath, false, Encoding.UTF8))
            {
                m_streamWriter.Flush();
                m_streamWriter.BaseStream.Seek(0, SeekOrigin.Begin);
                m_streamWriter.Write(content);
            }

        }
    }

    public class PageInfo
    {
        /// <summary>
        /// 網址
        /// </summary>
        public string loc { get; set; }

        /// <summary>
        /// 最後更新時間
        /// </summary>
        public string lastmod { get; set; }

        /// <summary>
        /// 更新頻繁程度
        /// </summary>
        public string changefreq { get; set; }

        /// <summary>
        /// 優先順序,0-1
        /// </summary>
        public string priority { get; set; }
    }
}

 

下載:https://files.cnblogs.com/files/jackrebel/BaiduSiteMap.zip

非常簡單的源代碼。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 常用API 基本類型包裝類概述 將基本數據類型封裝成對象的好處可以在對象中定義更多的功能方法操作該數據 常用的操作之一:用於基本數據類型與字元串之間的轉換 | 基本數據類型 | 包裝類 | | | | | byte | Byte | | short | Short | | int | Integer ...
  • 概述前幾篇文章分享了 array 數組、slice 切片、map 集合,這篇文章分享如何迴圈獲取裡面的元素,同時也是對前幾篇文章的複習。本篇文章會用到的關鍵字 for、range、break、continue、goto、switch。迴圈 array //demo_18.go package mai ...
  • 列印index 對於一個列表,或者說一個序列我們經常需要列印它的index,一般傳統的做法或者說比較low的寫法: 更優雅的寫法是多用enumerate 兩個序列的迴圈 我們會經常對兩個序列進行計算或者處理,比較low的方法是用下標去迴圈處理 更優雅一點的方法:用zip輕鬆搞定 有沒有更優雅的方法呢 ...
  • “人生苦短,我用Python”。Python編程語言是最容易學習、並且功能強大的語言。只需會微信聊天、懂一點英文單詞即可學會Python編程語言。但是很多人聲稱自己精通Python,然後自己卻寫不出Pythonic的代碼,對很多常用的包不是很瞭解。萬丈高樓平地起,咱們先從Python中最最基礎的開始 ...
  • 1.print 列印帶有顏色的信息 大家知道 Python 中的信息列印函數 print,一般我們會使用它列印一些東西,作為一個簡單調試。 但是你知道麽,這個 Print 列印出來的字體顏色是可以設置的。 一個小例子 在控制台或者 Pycharm 運行這段代碼之後你會得到結果。 其中 Error 是 ...
  • 單例模式 單例模式的含義: 作為對象的創建模式,單例模式確保某一個類只有一個實例,而且自行實例化並向整個系統全局地提供這個實例。它不會創建實例副本,而是會向單例類內部存儲的實例返回一個引用。 單例模式的三個要素: 1. 保存類唯一實例的靜態變數。 2. 構造函數和克隆函數必須是私有的,放在外部去實例 ...
  • .NET Core 對龍芯的支持情況和對 .NET Core 開發嵌入式的思考 [TOC] 一,遺憾的嘗試 前些天看到了張隊公眾推送的《 "Asp.Net終於可以在龍芯伺服器上運行啦:Jexus成功完成對國產系列CPU的適配" 》,聯想到上一周與朋友在龍芯搗鼓 .NET Core,就想寫一下關於 . ...
  • elastic各產品下載列表頁: "https://www.elastic.co/cn/downloads/" 打開 "Elasticsearch的下載頁" 後看到的是當前最新版本的安裝界面,現在最新的版本是7.4.2,如果想要安裝低版本的怎麼辦呢? 7.4.2的MSI安裝包的鏈接是:https:/ ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...