電影院要開工了，用Python看一看最近有什麼剛上映的電影

-Advertisement-

前言貓眼電影是淘寶聯合打造電影分類最全的電影的平臺，能夠第一時間告知用戶，最新的電影上線時間。今天教大家獲取貓眼電影的即將上映的電影詳情。項目目標獲取貓眼電影的即將上映的電影詳情。項目準備軟體：PyCharm 需要的庫：requests、lxml、random、time 插件：Xpath ...

前言

貓眼電影是淘寶聯合打造電影分類最全的電影的平臺，能夠第一時間告知用戶，最新的電影上線時間。今天教大家獲取貓眼電影的即將上映的電影詳情。

項目目標

獲取貓眼電影的即將上映的電影詳情。

項目準備

軟體：PyCharm

需要的庫：requests、lxml、random、time

插件：Xpath

網站如下：

https://maoyan.com/films?showType=2&offset={}

點擊下一頁的按鈕，觀察到網站的變化分別如下：

https://maoyan.com/films?showType=2&offset=30
https://maoyan.com/films?showType=2&offset=60
https://maoyan.com/films?showType=2&offset=90

點擊下一頁時，頁面每增加一頁offset=()每次增加30，所以可以用{}代替變換的變數，再用for迴圈遍歷這網址，實現多個網址請求。

項目實現

1、定義一個class類繼承object，定義init方法繼承self，主函數main繼承self。導入需要的庫和網址，代碼如下所示。

import requests
from lxml import etree

import time
import random

class MaoyanSpider(object):
    def __init__(self):
      self.url = "https://maoyan.com/films?showType=2&offset={}"

    def main(self):
        pass

if __name__ == '__main__':
    spider = MaoyanSpider()
    spider.main()

2、隨機產生UserAgent。

 for i in range(1, 50):
    # ua.random,一定要寫在這裡,每次請求都會隨機選擇。
        self.headers = {
            'User-Agent': ua.random,
        }

3、發送請求，獲取頁面響應。

def get_page(self, url):
  # random.choice一定要寫在這裡,每次請求都會隨機選擇
  res = requests.get(url, headers=self.headers)
  res.encoding = 'utf-8'
  html = res.text
  self.parse_page(html)

4、xpath解析一級頁面數據，獲取頁面信息。

1）基準xpath節點對象列表。

 # 　創建解析對象
parse_html = etree.HTML(html)
# 基準xpath節點對象列表
dd_list = parse_html.xpath('//dl[@class="movie-list"]//dd')

2）依次遍歷每個節點對象，提取數據。

 for dd in dd_list:
    name = dd.xpath('.//div[@class="movie-hover-title"]//span[@class="name noscore"]/text()')[0].strip()
    star = dd.xpath('.//div[@class="movie-hover-info"]//div[@class="movie-hover-title"][3]/text()')[1].strip()
    type = dd.xpath('.//div[@class="movie-hover-info"]//div[@class="movie-hover-title"][2]/text()')[1].strip()
    dowld=dd.xpath('.//div[@class="movie-item-hover"]/a/@href')[0].strip()
    # print(movie_dict)
    movie = '''【即將上映】

5、定義movie，保存列印數據。

movie = '''【即將上映】
            
電影名字: %s

主演：%s

類型：%s
詳情鏈接：https://maoyan.com%s
=========================================================
                                   ''' % (name, star, type,dowld)
print( movie)

6、random.randint()方法，設置時間延時。

time.sleep(random.randint(1, 3))

7、調用方法，實現功能。

html = self.get_page(url)self.parse_page(html)

效果展示

1、點擊綠色小三角運行輸入起始頁，終止頁。

2、運行程式後，結果顯示在控制台，如下圖所示。

3、點擊藍色下載鏈接, 網路查看詳情。

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯繫我們以作處理。

作者：Python進階者

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

複雜度分析的套路及常見的複雜度

前言本篇文章收錄於專輯：http://dwz.win/HjK，點擊解鎖更多數據結構與演算法的知識。你好，我是彤哥，一個每天爬二十六層樓還不忘讀源碼的硬核男人。上一節，我們一起學習了表示覆雜度的幾個符號，我們說，通常使用大O來表示演算法的複雜度，不僅合理，而且書寫方便。那麼，使用大O表示法評估演算法 ...
簡單的高考查詢，不完善，技術菜鳥

data ={ '魏X':{"語文":["150"], "數學":["150"], "英語":["150"], "綜合":{ '化學':["90"], '物理':["90"], }, }, '黃XX':{"語文":["150"], "數學":["150"], "英語 ...
C++ boost庫的安裝

###Windows安裝boost庫下載鏈接：https://www.boost.org/ 學習鏈接：https://theboostcpplibraries.com/ ######1，下載解壓，我的目錄“C:\Program Files (x86)\Microsoft Visual Studio ...
Python編程整理：通過修改實例類變數改變類的類變數的問題（成因：類變數為可變變數）

先上代碼， class C1(object): class_variable = 1 class C2(object): class_variable = [] object1 = C1() object2 = C2() print(C1.class_variable) # 1 print(obje ...
c++程式員轉java開發入門指南

有一段時間沒有更新文章了，因為最近參加了公司一個項目開發，要求用java寫，這樣才方便引用公司其它團隊現成的技術組件。由於以前沒學過java，所以最近一段時間花了不少時間學java開發知識中間遇上不少小問題，一路跌跌撞撞過來，上周終於用java寫好了一個小模塊。由於剛接觸一塊新事務，工作比較忙 ...
Java Web(3)-XML

一、XML簡介 1. 什麼是xml？ xml 是可擴展的標記性語言 2. xml的作用？用來保存數據，而且這些數據具有自我描述性它還可以做為項目或者模塊的配置文件還可以做為網路傳輸數據的格式（現在 JSON 為主）二、XML語法首先創建一個xml文件 <?xml version="1.0" ...
Selenium

1，下載瀏覽器chrome 2，驅動下載：http://npm.taobao.org/mirrors/chromedriver/ 對應版本下載後放入path from selenium import webdriver from selenium.webdriver.chrome.options i ...
鞏固複習(Hany驛站原創)_python的禮物

Python編程語言簡介 https://www.cnblogs.com/hany-postq473111315/p/12256134.html Python環境搭建及中文編碼 https://www.cnblogs.com/hany-postq473111315/p/12256337.html P ...