測試博客園的閱讀量計算方式

-Advertisement-

內容：通過wget批量下載我自己博客園的隨筆頁面，看閱讀量是否增加環境：kali+python思路：1、在終端利用調用腳本的方式執行python腳本，比如：python add_readcounts.py -f my_blogs2、對爬蟲不熟，但是也不能把每一篇隨筆的鏈接加入到代碼中，使用一個文本保 ...

內容：通過wget批量下載我自己博客園的隨筆頁面，看閱讀量是否增加
環境：kali+python
思路：1、在終端利用調用腳本的方式執行python腳本，比如：python add_readcounts.py -f my_blogs
2、對爬蟲不熟，但是也不能把每一篇隨筆的鏈接加入到代碼中，使用一個文本保存，獲取一個file變數
3、通過python執行系統命令

 1 import optparse
 2 
 3 #get the file that user input, return the open file，通過終端輸入拿到文件名稱並且打開，返回一個file變數
 4 def get_file():
 5     parser = optparse.OptionParser("usage %prog"+"-f <link_file>") # 運行腳本的格式
 6     parser.add_option('-f', dest = 'fname',type = 'string', help = 'specify link file')   # 添加運行腳本的變數
 7     (options, args) = parser.parse_args()  # 把終端獲取的變數進行保存，這裡不知道怎麼解釋，有點要意會
 8     if options.fname == None:    # 文件位置參數不正確，輸出使用方法，程式結束
 9         print parser.usage
10     file_name = options.fname
11     #file_name = 'test'
12     f = open(file_name,'r')
13     return f
14 
15 # execute the shell commands 執行命令，我測試了幾種方法
16 #import subprocess
17 import commands,os
18 def execute_shell(s):
19     #obj = subprocess.Popen('wget',shell=True,stdout=subprocess.PIPE)
20     #x = obj.stdout.read()       這是第一種方法，有點問題，因為不熟悉就沒有使用
21     shell_command = ' '.join(['wget','-O','x',s])    # 因為wget是下載網頁，所以我把每次的結果都寫到一個文件裡面，這樣不會生成很多網頁
22     #print(shell_command)
23     os.system(shell_command)          # 通過系統執行命令
24     #print(commands.getstatusoutput(shell_command))
25     #(status, result) = commands.getstatusoutput(shell_command) # 這種方法會阻塞，所以也不使用
26     #print(result)  
27     
28 
29 
30 import re
31 if __name__ == '__main__':
32     f = get_file()
33     run_num = 0
34     for s in f:
35         #s = re.sub(';','',s)
36         #print(s)
37         execute_shell(s)
38         run_num += 1
39     
40     print 'the website is :',run_num

View Code

忘記放我的文本文件上來了，現在補上

文件名：my_blogs

內容

http://www.cnblogs.com/-nbloser/p/7854170.html
http://www.cnblogs.com/-nbloser/p/7873562.html
http://www.cnblogs.com/-nbloser/p/7901274.html
http://www.cnblogs.com/-nbloser/p/7901295.html
http://www.cnblogs.com/-nbloser/p/7979969.html

。。。。。。

我多次運行過後發現，我win10點擊+虛擬機點擊都會增加1，再次點擊不會出現增加的數量，可能是記錄電腦的某個信息。所以這種刷的方式可能不是很實用。不過寫這個程式倒是蠻有意思的。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Django使用Celery非同步任務隊列

1 Celery簡介 Celery是非同步任務隊列，可以獨立於主進程運行，在主進程退出後，也不影響隊列中的任務執行。任務執行異常退出，重新啟動後，會繼續執行隊列中的其他任務，同時可以緩存停止期間接收的工作任務，這個功能依賴於消息隊列（MQ、Redis）。 1.1 Celery原理 Celery的架構 ...
Java基礎--day05

1、方法的定義格式及解析（1）方法概述：方法就是完成特定功能的代碼塊。（2）定義格式：修飾符返回值類型方法名(參數1，參數2，參數3...){ 函數體； return 返回值； } （3）修飾符：公共類public、私有類private、抽象類abstract、最終類final。（4）返 ...
STM32高級定時器TIM1產生兩路互補的PWM波（帶死區）

測試環境：Keil 5.20.0.0 STM32F103RBT6 固件庫版本:STM32F10x_StdPeriph_Lib_V3.5.0（2011）本文使用TIM1的通道1，通道2，產生兩路1khz，死區時間1us的互補PWM波。所使用的IO口：由下圖知，我們使用引腳為PA9，PA10，互補輸 ...
java學習筆記（二）

一.java常用數據類型 int 只有 true或false沒有0或非0 二.數據類型轉換 1.自動轉換：byte ->short int->char->int->long int ->float->double 轉換條件：由低類型向高類型（即箭頭所指的轉換方向）變數類型不會改變，但計算值會變為高類 ...
「BZOJ3600」沒有人的算術替罪羊樹+線段樹

題目描述過長……不想發圖也不想發文字，所以就發鏈接吧…… [沒有人的算術][1] 題解 $orz$神題一枚我們考慮如果插入的數不是數對，而是普通的數，這就是一道傻題了——直接線段樹一頓亂上就可以了。於是我們現在只需要解決一個問題——維護這些數的大小關係。由於這些數具有有序性，我們可以將這些數 ...
volatile關鍵值

happens before原則我們編寫的程式都要經過優化後（編譯器和處理器會對我們的程式進行優化以提高運行效率）才會被運行，優化分為很多種，其中有一種優化叫做重排序，重排序需要遵守happens before規則，換句話說只要滿足happens before原則就可以進行重排序。定義 :在JM ...
java XML 通過BeanUtils的population為對象賦值根據用戶選擇進行dom4j解析

根據xml文件設計Student對象設計學生類根據菜單進行解析使用jar包 ...
抽象類和抽象方法以及和介面區別

一、抽象類抽象類、具體類是相對的，並非絕對的。抽象是一種概念性名詞，具體是一種可見可觸摸的現實對象。概念越小，則其抽象程度就越大，其外延也越大，反之亦然。簡單說，比如“人”比“男人”抽象一點，而“生物”又比“人”更抽象一點，“物質”又比“生物”更抽象。抽象的概念是由具體概念依其“共性”而產生的， ...