哈嘍兄弟們,今天來試試批量獲取公眾號文章,emmm… 雖然名義上是文章,單其實它是一篇純圖片文,至於為什麼不是文字,小姐姐不比文字香? 事前準備 我們需要用到 Fiddler Everywhere 這個軟體,Crack是本次要使用到的文件,以及要安裝微信PC版客戶端,我專門錄了一個安裝 及使用的教程 ...
哈嘍兄弟們,今天來試試批量獲取公眾號文章,emmm…
雖然名義上是文章,單其實它是一篇純圖片文,至於為什麼不是文字,小姐姐不比文字香?
事前準備
我們需要用到 Fiddler Everywhere 這個軟體,Crack是本次要使用到的文件,以及要安裝微信PC版客戶端,我專門錄了一個安裝 及使用的教程。
本次使用的是Python3.8 以及 pycharm2021,這是目前比較穩定的版本。
模塊方面需要安裝一個requests 模塊,它是第三方模塊,需要手動安裝,win+R 打開運行框輸入cmd 按回車打開命令提示符視窗,輸入pip install requests 按回車即可安裝。
效果展示
太過份的我就不展示了,影響不好,我們是技術愛好者,不是那啥愛好者~
主要代碼
# 軟體和安裝教程、代碼在這個群 279199867 自取哈 headers = { 'Host': 'mp.weixin.qq.com', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36 NetType/WIFI MicroMessenger/7.0.20.1781(0x6700143B) WindowsWechat(0x63060012)', 'Cookie': 'wxuin=2408215323; lang=zh_CN; pass_ticket=TsrY5cXMvTN01ghVFxFxT9k4jdPONJBt8mdl0ta20qxjUHNsnkkWLjib4gXCXSQM; devicetype=android-29; version=2800153f; wap_sid2=CJvmqfwIEooBeV9IQVVCUVAzdVBlWEo5NTlySFpON1Ffek5zTE9qRi1jdWZjVFMyOFYyM0FyVE9RSTRNZ3VuUXFTcU94Q3lKY1VyQlJ2RkEtTWFyRWFLeHhJUTRrWmp0N0VDZ05zOFV4d0kzZ1p5cXBIbTVBbEZGRWJteEt4Q0oxSjY4ZHFhODlaZnMyY1NBQUF+MOXS6ZIGOA1AlU4=', } # ::text for page in range(0, 3): url = f'https://mp.weixin.qq.com/mp/profile_ext?action=getmsg&__biz=MzU0MzU4OTY2NQ==&f=json&offset={page * 10}&count=10&is_ok=1&scene=&uin=777&key=777&pass_ticket=&wxtoken=&appmsg_token=1161_7%252BO7mVaQbImKSRrYWqKBnNggweX4WNZaqjadeg~~&x5=0&f=json' json_data = requests.get(url=url, headers=headers).json() general_msg_list = json_data['general_msg_list'] general_msg_list = json.loads(general_msg_list)['list'] # print(general_msg_list) title_list = [] content_url_list = [] for general_msg in general_msg_list: title = general_msg['app_msg_ext_info']['title'] content_url = general_msg['app_msg_ext_info']['content_url'] multi_app_msg_item_list = general_msg['app_msg_ext_info']['multi_app_msg_item_list'] title_list.append(title) content_url_list.append(content_url) for multi_app_msg_item in multi_app_msg_item_list: title_list.append(multi_app_msg_item['title']) content_url_list.append(multi_app_msg_item['content_url']) # print(title_list) # print(content_url_list) zip_data = zip(title_list, content_url_list) for detail_title, detail_url in zip_data: if not os.path.exists('img/' + detail_title): os.mkdir('img/' + detail_title) # 1. 發送請求 response = requests.get(url=detail_url, headers=headers) # 2. 獲取數據 html_data = response.text # 3. 解析數據 # 正則匹配數據 第一個參數 需要匹配的規則 # 第一個參數 在哪個字元串裡面匹配 img_list = re.findall('data-src="(https://mmbiz\.qpic\.cn/.*?)"', html_data) print(detail_title)
我也錄製了對應的視頻講解:Python採集公眾號文章
最後推薦一套Python教程:Python實戰100例