博客園備份小工具使用加代碼說明（Java小程式）

-Advertisement-

前言寫了兩年多的博客了，我想整理我的博客，問題是，得一個個打開，之後複製粘貼，嫌這樣太麻煩，於是便找到了博客園的備份功能。但是這個備份功能下載下來的只是一個xml文件，我想把每一篇博文都轉為一個md文件，於是便有了這個Java小工具。工具下載 "BlogBackupTool" 使用說明從博客 ...

前言

寫了兩年多的博客了，我想整理我的博客，問題是，得一個個打開，之後複製粘貼，嫌這樣太麻煩，於是便找到了博客園的備份功能。

但是這個備份功能下載下來的只是一個xml文件，我想把每一篇博文都轉為一個md文件，於是便有了這個Java小工具。

工具下載

BlogBackupTool

使用說明

從博客園上下載備份的xml文件將本項目下載，打開run.bat,輸入前面下載的xml文件的地址，即會在xml文件的同目錄生成一個博客園的文件夾，裡面存放MD文件和Html文件

程式講解

涉及知識

IO流
xml解析

xml文件分析

從博客園下載的xml備份文件，格式大概是這樣的

<channel>
    <title></title>
    <link></link>
    <description<</description>
    <language></language>
    <lastBuildDate></lastBuildDate>
    <pubDate></pubDate>
    <ttl></ttl>
    <item></item>
    <item></item>
    ...
</channel>

其中的item就是我們博客中每一篇博文

item結構

<item>
    <title></title>
    <link></link>
    <dc:creator></dc:creator>
    <author></author>
    <pubDate></pubDate>
    <guid></guid>
    <description></description>
<item>

item結點之下還有子結點
title是我們的博文標題

link則是我們博文對應的鏈接

description則是我們博客的內容

    NodeList itemLists = document.getElementsByTagName("item");//獲得所有的item結點
    for (int i = 0; i < itemLists.getLength(); i++) {
        NodeList list = itemLists.item(i).getChildNodes();//獲得item結點之下的全部結點，有7個，下標從0開始
        String title = list.item(0).getTextContent();//第一個結點內容是標題
        String link = list.item(1).getTextContent();//第二個結點內容是鏈接
        String description = list.item(6).getTextContent();
        fileWrite(title,link,description);
    }

PS：這裡需要註意到是，description裡面獲取的內容我們查看的時候發現是下麵這樣的代碼

這個CDATA其實是個xml的標準標簽，表明這裡面的內容都是文本（上面的也就是測試和句號才是內容，解析的時候會忽略掉兩個中括弧）

區分md文件和html文件

如果是md文件，開頭不可能出現<這個符號，如果是html文件，因為要使用到各種標簽，p,h,div等標簽，肯定開頭是有<這個符號的

html文件轉md文件

如果想不想要html文件，想要md文件的話，就得手動去整理格式，可以先使用線上的工具將html文件轉為md格式，這個百度一下就有工具了，不過還得慢慢整理一下，格式轉換過來不一定符合排版，我們得手動地去排個版。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

一些Java基礎方面問題的總結

最近做面試題，遇到一些問題，整理一下！ 1、Overloaded的方法是否可以改變返回值的類型？答案：可以。 overload是重載，overloaded是什麼？重載的過去式？我還以為是我沒見過的註解，也沒有給限定條件，代碼測試一下。註釋部分報錯，很明顯，如果吧這個單詞也解釋為重載的話，重載的基 ...
重載操作符 'operator'

operator 是 C++ 的（運算符的）重載操作符。用作擴展運算符的功能。它和運算符一起使用，表示一個運算符函數，理解時應將【operator+運算符】整體上視為一個函數名。要註意的是：一方面要使運算符的使用方法與其原來一致，另一方面擴展其功能只能通過函數的方式（c++中，“功能”都是由 ...
python編程規範系列--建議08～18

本系列來自《編寫高質量代碼改善python程式的91個建議》的讀書筆記整理。python編程規範系列--建議08～18 ...
設計模式：策略模式

什麼是策略模式策略是我們在處理問題是所採用的步驟方法。如我要過年回家，方式有飛機、火車，汽車等，這幾種方式就是策略。再比如我們商城要搞一個活動，給用戶生成一批優惠券，5折，7折，免單等，這些方法也是策略。一個策略模式的例子：模擬一個銷售給客戶報價的業務場景。我們銷售人員對不同的客戶制定不同的 ...
Java相關資料分享（視頻+電子書籍）

正所謂“授人以魚不如授人以漁”，你們想要的Java學習資料來啦！不管你是學生，還是已經步入職場的同行，希望你們都要珍惜眼前的學習機會，奮鬥沒有終點，知識永不過時。關註底下的公眾號，獲取百度網盤提取碼即可下載！ 1. Java編程思想電子書鏈接：https://pan.baidu.com/s/1p ...
dedecmsv5.7 前臺模版里輸出變數

如何在PHP文件查詢出來的數據賦值給前端頁面展示出來？例如： PHP文件：agency.php 前端模版：edit_face.htm 或者：輸出變數：{dede:global.變數名} ...
pandas中的series數據類型

import pandas as pd import numpy as np import names ''' 寫在前面的話： 1、series與array類型的不同之處為series有索引，而另一個沒有;series中的數據必須是一維的，而array類型不一定 2、可以把series看成一個定長的... ...
20190118-自定義實現replace方法

1.自定義實現replace方法 Python replace() 方法把字元串中的 old（舊字元串）替換成 neange(新字元串)，如果指定第三個參數max，則替換不超過 max 次。考慮old與nein的長度不一樣的情況，如old = 'is';new = 'was' 思路： 1.先找出字 ...