博客園備份小工具使用加代碼說明(Java小程式)

来源:https://www.cnblogs.com/kexing/archive/2019/01/18/10289290.html
-Advertisement-
Play Games

前言 寫了兩年多的博客了,我想整理我的博客,問題是,得一個個打開,之後複製粘貼,嫌這樣太麻煩,於是便找到了博客園的備份功能。 但是這個備份功能下載下來的只是一個xml文件,我想把每一篇博文都轉為一個md文件,於是便有了這個Java小工具。 工具下載 "BlogBackupTool" 使用說明 從博客 ...


前言

寫了兩年多的博客了,我想整理我的博客,問題是,得一個個打開,之後複製粘貼,嫌這樣太麻煩,於是便找到了博客園的備份功能。

但是這個備份功能下載下來的只是一個xml文件,我想把每一篇博文都轉為一個md文件,於是便有了這個Java小工具。

工具下載

BlogBackupTool

使用說明

從博客園上下載備份的xml文件 將本項目下載,打開run.bat,輸入前面下載的xml文件的地址,即會在xml文件的同目錄生成一個博客園的文件夾,裡面存放MD文件和Html文件

程式講解

涉及知識

  1. IO流
  2. xml解析

xml文件分析

從博客園下載的xml備份文件,格式大概是這樣的

<channel>
    <title></title>
    <link></link>
    <description<</description>
    <language></language>
    <lastBuildDate></lastBuildDate>
    <pubDate></pubDate>
    <ttl></ttl>
    <item></item>
    <item></item>
    ...
</channel>

其中的item就是我們博客中每一篇博文

item結構

<item>
    <title></title>
    <link></link>
    <dc:creator></dc:creator>
    <author></author>
    <pubDate></pubDate>
    <guid></guid>
    <description></description>
<item>

item結點之下還有子結點
title是我們的博文標題

link則是我們博文對應的鏈接

description則是我們博客的內容

    NodeList itemLists = document.getElementsByTagName("item");//獲得所有的item結點
    for (int i = 0; i < itemLists.getLength(); i++) {
        NodeList list = itemLists.item(i).getChildNodes();//獲得item結點之下的全部結點,有7個,下標從0開始
        String title = list.item(0).getTextContent();//第一個結點內容是標題
        String link = list.item(1).getTextContent();//第二個結點內容是鏈接
        String description = list.item(6).getTextContent();
        fileWrite(title,link,description);
    }

PS:這裡需要註意到是,description裡面獲取的內容我們查看的時候發現是下麵這樣的代碼

這個CDATA其實是個xml的標準標簽,表明這裡面的內容都是文本(上面的也就是測試和句號才是內容,解析的時候會忽略掉兩個中括弧)

區分md文件和html文件

如果是md文件,開頭不可能出現<這個符號,如果是html文件,因為要使用到各種標簽,p,h,div等標簽,肯定開頭是有<這個符號的

html文件轉md文件

如果想不想要html文件,想要md文件的話,就得手動去整理格式,可以先使用線上的工具將html文件轉為md格式,這個百度一下就有工具了,不過還得慢慢整理一下,格式轉換過來不一定符合排版,我們得手動地去排個版。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 最近做面試題,遇到一些問題,整理一下! 1、Overloaded的方法是否可以改變返回值的類型? 答案:可以。 overload是重載,overloaded是什麼?重載的過去式?我還以為是我沒見過的註解,也沒有給限定條件,代碼測試一下。 註釋部分報錯,很明顯,如果吧這個單詞也解釋為重載的話,重載的基 ...
  • operator 是 C++ 的(運算符的)重載操作符。用作擴展運算符的功能。 它和運算符一起使用,表示一個運算符函數,理解時應將 【operator+運算符】 整體上視為一個函數名。 要註意的是:一方面要使運算符的使用方法與其原來一致,另一方面擴展其功能只能通過函數的方式(c++中,“功能”都是由 ...
  • 本系列來自《編寫高質量代碼 改善python程式的91個建議》的讀書筆記整理。python編程規範系列--建議08~18 ...
  • 什麼是策略模式 策略是我們在處理問題是所採用的步驟方法。如我要過年回家,方式有飛機、火車,汽車等,這幾種方式就是策略。 再比如我們商城要搞一個活動,給用戶生成一批優惠券,5折,7折,免單等,這些方法也是策略。 一個策略模式的例子: 模擬一個銷售給客戶報價的業務場景。我們銷售人員對不同的客戶制定不同的 ...
  • 正所謂“授人以魚不如授人以漁”,你們想要的Java學習資料來啦!不管你是學生,還是已經步入職場的同行,希望你們都要珍惜眼前的學習機會,奮鬥沒有終點,知識永不過時。 關註底下的公眾號,獲取百度網盤提取碼即可下載! 1. Java編程思想電子書 鏈接:https://pan.baidu.com/s/1p ...
  • 如何在PHP文件查詢出來的數據賦值給前端頁面展示出來? 例如: PHP文件:agency.php 前端模版:edit_face.htm 或者: 輸出變數:{dede:global.變數名} ...
  • import pandas as pd import numpy as np import names ''' 寫在前面的話: 1、series與array類型的不同之處為series有索引,而另一個沒有;series中的數據必須是一維的,而array類型不一定 2、可以把series看成一個定長的... ...
  • 1.自定義實現replace方法 Python replace() 方法把字元串中的 old(舊字元串) 替換成 neange(新字元串),如果指定第三個參數max,則替換不超過 max 次。考慮old與nein的長度不一樣的情況,如old = 'is';new = 'was' 思路: 1.先找出字 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...