下載博客首頁的博客列表

来源:http://www.cnblogs.com/y15821933792/archive/2017/11/07/7797197.html

-Advertisement-

以上代碼是獲取博客文章的列表 ...

url_con = urllib.urlopen('http://blog.sina.com.cn/s/articlelist_1193111400_0_1.html').read()
print 'con' ,url_con

url = ['']*40
i = 0
title = url_con.find(r'<a title=')

print "title",title
href = url_con.find(r'href=',title)
print "href",href

html = url_con.find(r'.html',href)
print "html",html


while title != -1 and href != -1 and html != -1 and i < 40:
    url[i] = url_con[href+6:html+5]
    print url[i]
    title = url_con.find(r'<a title=',html)
    
    href = url_con.find(r'href=',title)
    
    html = url_con.find(r'.html',href)
    
    filename = url[-26:]

    i = i + 1
j = 0
while j < 40:
    content = urllib.urlopen(url[j]).read()
    filename = url[j][-26:]
    open(r'blog/'+ filename,'w').write(content)
    j = j+ 1
    time.sleep(5)

以上代碼是獲取博客文章的列表

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

FileStream文件的使用

// FileStream//(操作位元組的)水一勺一勺的可以操作任意格式的文件 //File一下子就讀出來 //讀取文本文件寫入文本文件使用文件流實現多媒體文件文件的複製 ...
C#實現工作日和休息日(包括法定節假日)的計算

早就萌生了寫博客的想法，一直到現在才動手，原因有多方面，歸根結底就是一個字~懶。今天無意看到一片博文，覺得裡面說得幾點原因很對，原文地址：我們為什麼應該堅持寫博客，感謝作者，讓我有動力寫了這篇博文。其實寫博文是想記錄自己遇到的一些問題的解決思路，方便以後查閱，同時希望可以跟大家一起交流提高。先介 ...
Quarzt定時調度任務

簡介 Quarzt是一個項目中定時執行任務的開源項目,Quartz是OpenSymphony開源組織在Job scheduling領域又一個開源項目，它可以與J2EE與J2SE應用程式相結合也可以單獨使用，這裡我們介紹和整合的例子因為Spring已經整合Quarzt，所以我們只需要配置一下即可。 ...
加快cin、cout輸入輸出的小技巧

std::ios::sync_with_stdio(false); std::cin.tie(nullptr); 第一句話是解除ios與stdio之間的同步關係。第二句話是解除cin與cout之間的綁定。在開始讀入數據前，插入這兩句話就可以加快cin、cout的輸入輸出速度。cin、cout運作速 ...
第四章函數作業題，有參函數的調用

一個方法可以執行不同個數參數，前提是聲明時賦值 ...
第四章函數作業題，函數模板

什麼是函數模板？就是不寫具體的數據類型，而用一個虛擬類型來代表，這樣可以提高效率。 ...
<學習筆記>關於圖的理論知識

什麼是圖|ω･`) 圖G是一個有序二元組(V,E)，其中V稱為頂集(Vertices Set)，E稱為邊集(Edges set)，E與V不相交。它們亦可寫成V(G)和E(G)。 E的元素都是二元組，用(x,y)表示，其中x,y∈V。（摘自百度百科）簡單來說，圖就是由點和邊組成的東西。也可以理解為 ...
第四章函數作業題，內置函數

什麼是內置函數？也成內聯函數嵌入到主函數中的函數稱為內置函數，也就是雖然函數寫在main()的外邊，但是我們通過一個關鍵字inline進行標識，這樣就可以把寫在外邊的函數當成寫在了主函數main()的裡邊。一個函數寫在主函數外邊與寫在主函數裡邊有什麼區別？都可以正常運行，但程式效率不同。寫在主函 ...

一周排行

-Advertisement-

移動開發（一）：使用.NET MAUI開發第一個安卓APP

移動開發（一）：使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說，近來想嘗試開發一款安卓APP，考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP，畢竟是使用Visual Studio開發工具，使用起來也比較的順手，結合微軟官方的教程進行了安卓 ...
wpf ToggleButton選中效果和一個登錄界面

前言 QuestPDF 是一個開源 .NET 庫，用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。項目介紹 QuestPDF 是一個革命性的開源 .NET 庫，它徹底改變了我們生成 PDF 文檔的方 ...
彈幕樹洞項目功能新增篇

項目地址項目後端地址： https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址： ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址： http://tree ...
第27篇 sqlserver2022詳細安裝步驟

話不多說，直接開乾一.下載 1.官方鏈接下載： https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe，運行開始下載SQL server；二. ...
.NET 開源高性能 MQTT 類庫

前言隨著物聯網（IoT）技術的迅猛發展，MQTT（消息隊列遙測傳輸）協議憑藉其輕量級和高效性，已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫，為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。本文將全面介紹 MQTTnet 的核心功能 ...
Serilog文檔翻譯系列（六） - 可用的接收器、增強器、格式化輸出

Serilog支持多種接收器用於日誌存儲，增強器用於添加屬性，LogContext管理動態屬性，支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項，適用於不同需求。 ...
警惕 Visual Studio 屬性求值副作用導致邏輯不符合預期

目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章簡介動態內容網站使用 JavaScript 腳本動態檢索和渲染數據，爬取信息時需要模擬瀏覽器行為，否則獲取到的源碼基本是空的。本文使用的爬取步驟如下：使用 Selenium 獲取渲染後的 HTML 文檔使用 HtmlAgility ...
[使用目前最新版]HybridCLR6.9.0+YooAsset2.2.4實現純C# Unity熱更新方案 (一)

1.前言什麼是熱更新游戲或者軟體更新時，無需重新下載客戶端進行安裝，而是在應用程式啟動的情況下，在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR，Xlua，ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles，Addressable， ...
在 ASP.NET Core Web API 中使用操作篩選器統一處理通用操作

本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺，其實像阿裡雲，騰訊雲上面也可以。首先我們先去互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號註冊完成賬號後，它會送 ...
第28篇如何.net中實現高效可靠數據同步api

通過以下方式可以高效，並保證數據同步的可靠性 1.API設計使用RESTful設計，確保API端點明確，並使用適當的HTTP方法（如POST用於創建，PUT用於更新）。設計清晰的請求和響應模型，以確保客戶端能夠理解預期格式。 2.數據驗證在伺服器端進行嚴格的數據驗證，確保接收到的數據符合預期格 ...

所有分類