批量保存雲盤鏈接的deom_ZenDei技術網路在線

批量保存雲盤鏈接的deom

-Advertisement-

寫在前面的聲明：作為一個正在自學爬蟲的小白，用爬蟲爬了八千本書的雲盤鏈接，然後就想把這寫鏈接的資源都轉存到自己的雲盤裡，以防某一天資源失效。本來想在網上找個能夠批量保存的軟體，哪知道找到幾個都不能用，用手動保存肯定是不現實的。隨後想到才學的selenium能夠模擬瀏覽器的操作，就像自己寫段自動保存 ...

寫在前面的聲明：

　　作為一個正在自學爬蟲的小白，用爬蟲爬了八千本書的雲盤鏈接，然後就想把這寫鏈接的資源都轉存到自己的雲盤裡，以防某一天資源失效。本來想在網上找個能夠批量保存的軟體，哪知道找到幾個都不能用，用手動保存肯定是不現實的。隨後想到才學的selenium能夠模擬瀏覽器的操作，就像自己寫段自動保存的代碼。經過三四個小時的奮戰，有了以下的結果。我知道自己這個東西寫得很爛很爛，但這確實是我學習路上用已有的知識獨立思考獨立操作出的成果，畢竟它解決了我實際遇到的問題，這完全符合我當初自學編程的初衷，心裡還是很高興的。現在把代碼貼出來，讓各位大神老師見笑了，也是為瞭如果有哪位大神有類似的更好的工具，希望能夠分享一下。

from selenium import webdriver
import time

with open("books.txt") as f:
    links = f.readlines() # 從文件中讀取資源鏈接和密碼
    browser = webdriver.Chrome() # 實例一個瀏覽器對象
    expired = [] # 創建一個存儲過期鏈接的列表
    for link in links: # 遍歷
        url = link.split("----")[0] # 以----為分隔符，前半段為地址，後半段為密碼
        pw = link.split("----")[1]
        browser.get(url) # 請求資源鏈接
        time.sleep(2)
        if browser.page_source.find("zvbpPbMk") != -1: # 判斷鏈接是否有效
            browser.find_element_by_id("zvbpPbMk").send_keys(pw) # 輸入密碼
            browser.find_element_by_class_name("text").click() # 點擊確定
            time.sleep(2)
            if browser.page_source.find("user-name") != -1:
                print("正在保存  " + browser.find_element_by_xpath("//h2").text)
                browser.find_element_by_class_name("zbyDdwb").click() # 點選文件
                browser.find_element_by_xpath('//a[@class="g-button g-button-blue"]/span[@class="g-button-right"]/span[@class="text"]').click() # 點擊保存到網盤按鈕
                time.sleep(3)
                browser.find_element_by_xpath("//div[@class='dialog-footer g-clearfix']/a[2]").click() # 點擊確定
                time.sleep(2)
                print("保存成功  " + browser.find_element_by_xpath("//h2").text)
            else:
                print("正在保存  " + browser.find_element_by_xpath("//h2").text)
                browser.find_element_by_xpath("//dd[@class='CDaavKb']/a[1]").click() # 點擊登陸按鈕
                time.sleep(3)
                browser.find_element_by_xpath("//div[@class='tang-pass-footerBar']/p[2]").click() # 點擊賬號密碼登陸按鈕
                time.sleep(3)
                browser.find_element_by_name("userName").send_keys("15580502400") # 輸入賬號
                browser.find_element_by_name("password").send_keys("xvv19890224") # 輸入密碼
                browser.find_element_by_id("TANGRAM__PSP_10__submit").click() # 點擊確定
                time.sleep(3)
                browser.find_element_by_class_name("zbyDdwb").click() # 點選文件
                browser.find_element_by_xpath('//a[@class="g-button g-button-blue"]/span[@class="g-button-right"]/span[@class="text"]').click() # 點擊保存到網盤按鈕
                time.sleep(3)
                browser.find_element_by_xpath("//div[@class='dialog-footer g-clearfix']/a[2]").click() # 點擊確定
                time.sleep(2)
                print("保存成功  " + browser.find_element_by_xpath("//h2").text)
        else:
            # 把過期的鏈接添加到列表
            expired.append(url)
    # 列印過期的鏈接列表
    print(expired)

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

[寒假學習筆記]（二）Python初學

Python 學習 python的自學從幾個月前斷斷續續地進行，想好好利用這個寒假，好好地學一學。回顧已學習：基本操作、函數已有C++的一定基礎，只要註意python中比較特殊的部分就行進入正題 lambda表達式 1. 語法 lambda _args: _expression lambda ...
設計模式：模板方法模式

模板方法模式是編程中經常用到的模式，它定義了一個操作的演算法骨架，將某些步驟延遲到子類實現。這樣，新的子類可以在不改變一個演算法結構的前提下重新定義該演算法的某些特定步驟。核心：處理某個流程的代碼都已具備，但其中某個節點的代碼暫時不能確定，所以將這個節點的代碼實現轉移到子類完成。例子：模擬一個銀行 ...
Java運行時數據區概述

Java 虛擬機在執行Java程式的過程中會把它所管理的記憶體劃分為若幹個不同的數據區域,這些區域都有各自的用途 ...
大名鼎鼎的Requests庫用了什麼編碼風格？

原文：https://www.kennethreitz.org/essays/kenneth-reitzs-code-style 作者：Kenneth Reitz 原題：Kenneth Reitz’s Code Style™ Requests 的代碼庫使用 PEP-8 編碼風格。除了 PEP-8 ...
使用selenium和phantomJS瀏覽器登陸豆瓣的小演示

# 使用selenium和phantomJS瀏覽器登陸豆瓣的小演示 # 導入庫 from selenium import webdriver # 實例化一個瀏覽器對象 web = webdriver.PhantomJS() # 請求頁面 web.get("https://www.douban.com... ...
JVM記憶體模型圖以及簡單介紹

局部變數表：應用程式中定義的普通變數就存放在棧中，棧中變數的大小程式運行開始的時候已經固定。棧：方法執行時創建棧針，然後進入到棧中，根據先進後出的順序進行執行。堆：對重存放程式中創建的對象。新生代：新生代分為三個區域。Eden，ServivorFrom，ServivorTo。新創建的對象先存放 ...
支付寶app支付服務端的實現-Java版

前言最近在工作中需要使用支付寶app支付，在初次使用過程中也不可避免的出現了一些問題，那麼本次隨筆主要是概述支付寶app支付服務端的整個實現過程以及就服務端出現的一些問題做一些總結。 1.準備工作 1.1 入駐螞蟻金服開放平臺 https://open.alipay.com/platform/ho ...
SpringBoot集成rabbitmq（一）

前言 Rabbitmq是一個開源的消息代理軟體，是AMQP協議的實現。核心作用就是創建消息隊列，非同步發送和接收消息。通常用來在高併發中處理削峰填谷、延遲處理、解耦系統之間的強耦合、處理秒殺訂單。入門rabbitmq之前主要是想瞭解下秒殺排隊訂單入庫後，非同步通知客戶端秒殺結果。基礎知識 1、基本概 ...