全球票房73億的《海王》,是怎麼煉成的!

来源:https://www.cnblogs.com/happymeng/archive/2019/04/02/10640338.html
-Advertisement-
Play Games

寫在前面 用Python加上一些數據分析,來證明《海王》好看。 《海王》一部電影帶你重溫《馴龍高手》《變形金剛》《星球大戰》《星河戰隊》《鐵血戰士》《安德的游戲》《異形》可能還借鑒了對手的《鋼鐵俠》與《黑豹》劇情,再稍稍帶一點《大魚海棠》的味道,配上一丟丟溫子仁式恐怖片套路,優秀的商業片,應該是DC ...


寫在前面

用Python加上一些數據分析,來證明《海王》好看。

《海王》一部電影帶你重溫《馴龍高手》《變形金剛》《星球大戰》《星河戰隊》《鐵血戰士》《安德的游戲》《異形》可能還借鑒了對手的《鋼鐵俠》與《黑豹》劇情,再稍稍帶一點《大魚海棠》的味道,配上一丟丟溫子仁式恐怖片套路,優秀的商業片,應該是DC年度最佳了。溫子仁,優秀的集大成者。

在做數據分析之前,我們需要先對數據做清洗,將數據處理到最佳

讀取數據,讀取數據的時候記住,需要把header=None然後增加names

# 讀取數據
def get_data():
    df = pd.read_csv("haiwang.csv",sep=",",header=None,names=["nickName","cityName","content","approve","reply","startTime","avatarurl","score"],encoding="utf-8")
    return df

清洗數據

  1. 查看數據是否有重覆,採用drop_duplicates刪除數據
  2. 刪除數據之後,需要重置索引 reset_index
  3. 處理時間欄位為datetime類型
  4. 增加一個欄位為content_length查閱用戶評論數量
# 清洗數據
def clean_data():
    df = get_data()
    has_copy = any(df.duplicated())
    data_duplicated = df.duplicated().value_counts()
    #print(data_duplicated) # 查看有多少數據是重覆的
    data = df.drop_duplicates(keep="first")  # 刪掉重覆值
    data = data.reset_index(drop=True)  # 重置索引
    data["startTime"] = pd.to_datetime(data["startTime"])
    data["content_length"] = data["content"].apply(len)
    # print(data.isnull().any()) 判斷空值
    # print(data[data.isnull().values == True])
    # print(data[data.nickName=="."])
    return data

數據基本情況查看

查看所有數據情況

點贊的最高數目是2783 非常高了,但是平均值才0.25 可見,貓眼上人們並不是很喜歡點贊
回覆數最高的才43 可以說非常低了~
《海王》50%以上的人給了5分,肯定是很好看了~

在這裡插入圖片描述

看一下點贊最高的一些數據

幻影XL 獲得了最多的點贊,可以看一下他的評論內容。恩,寫的確實不錯~,誇了一下導演,這個地方出現一點小的疏漏,我看到貓眼點贊最高的,我竟然沒有抓取到數據,應該是給遺漏掉了,疏忽啊!

在這裡插入圖片描述

點贊排名

在這裡插入圖片描述

回覆排名

在這裡插入圖片描述

# 查看數據基本情況
def analysis1():
    data = clean_data()
    print(data.describe())
    # 刪除.
    # need_delete = data[data["nickName"]=="."]
    data = data[~(data['nickName']==".")]
    # data = data[~data['nickName'].isin(["."])]
    # data.drop(need_delete,axis=1,inplace=True)

    print(data["nickName"].describe())
    print(data["cityName"].describe())

查看nickName的描述,發現竟然有個. 需要把數據過濾掉,觀影此處最多的城市是北京

在這裡插入圖片描述

去除 . 數據的辦法是 data = data[~(data['nickName']==".")]

count 57838
unique 55934
top qzuser
freq 57
Name: nickName, dtype: object
看一下qzuser這個人發了57條都是啥?

這位老鐵還真的發了很多唉,一個勁的誇這個電影,O(∩_∩)O哈哈~

在這裡插入圖片描述

看評分

5分遙遙領先,周末的票已經買好,準備去看啦~

在這裡插入圖片描述

圖表的實現用的是pychats,官方文檔在

http://pyecharts.org/#/zh-cn/prepare

你可以去查閱文檔,看一下詳細的參數設置

# 分析打分score情況
def analysis2():
    data = clean_data()
    grouped = data.groupby(by="score")["nickName"].size()
    grouped = grouped.sort_values(ascending=False)
    index = grouped.index
    values = grouped.values
    # 柱狀圖
    bar = Bar("柱狀圖",title_pos="left",width=240)
    bar.add("",index,values,is_label_show=True,is_legend_show=True,mark_line=["min","max"])

    # Pie圖
    pie = Pie("餅圖",title_pos="right",width=240)
    pie.add("",index,values,radius=[45,65],center=[70,50],is_label_show=True,legend_pos="90%",legend_orient= "vertical")

    grid = Grid(page_title="《海王》評分詳情",width=1200,height=500)
    grid.add(bar,grid_right="50%")
    grid.add(pie, grid_left="70%")

    grid.render("html/score.html")
    print(data)
    print(data[data["score"]==0])

看評語

def analysis3():
    data = clean_data()
    sort_data = data.sort_values(by="content_length",ascending=False)
    print(sort_data.head(10)["content"])

節選幾個,可以看看,順便我還可以學習一下語文

劇情和特效在科幻片中的精彩佳作。劇情延續著海神波塞冬用的玄鐵打造的三叉戟鋪開,影片中的海王的身世讓力量成為了傳奇,他有其它亞特蘭蒂斯人不具備的亞特蘭王的能力。海王在漫畫中和其他很多英雄不一樣的是,他並不反感殺戮,甚至有些渴望鮮血,這使得他在外型和性格上很難討喜。溫子仁對海王的性格做了一定程度上的改編,弱化了他的殘忍,突出了他自卑的性格。整部《海王》錶面看上去是一場王位爭奪戰,實際是亞瑟戰勝自卑的成長史,而獲得三叉戟就是他性格極為重要的轉折點。

"溫子仁真的厲害,在這部電影的鏡頭上和音效上真的是下了功夫,影片中適時響起的音效結合畫面,很加分,影片大的方向來看是一部英雄成長史,有主角的披荊斬棘也有活潑溫情, 擅長拍恐怖驚悚題材的他,在有些鏡頭的處理上能讀到驚悚的味道,用最擅長的恐怖元素牢牢把握住觀眾的註意力,但點到為止沒破壞電影的整體氛圍,度把握的很不錯 ,DC這次請溫子仁操刀算是做對了一件事,而且海底世界的特效也相當給力,故事劇情上有幾個點的設計很靈性,我覺得比毒液好看,因為毒液前面殺人的驚悚畫面嚇到我了,當然這部電影不是沒有缺點,比如有幾個地方我覺得節奏進程過快,劇情套路容易被猜中等等,但畢竟放眼整部影片來看,我給出四個字——瑕不掩瑜"

特效還可以的啦,但是劇情真的細碎,就本人而言槽點滿滿,起因在於海網的母親因為生下海王而死,也沒在海王小時候就派人弄死他,之後奧姆因為陸地人伏擊他們決定發起戰爭(也有可能是奧姆的陰謀,但是海底人被各種殘害是事實)結果眉拉,作為奧姆的青梅竹馬就背叛奧姆了,就去找海王了,也不知道怎麼一牽手,一擁抱,就擦起了愛情的火花(很多人說女主超級美,我看到了寡姐的影子,一頭紅髮,犀利的眼神,個人感覺像寡姐的山寨)然後海王就找到了三叉戟,開啟了主角光環之嘴炮無敵,拿到三叉戟,噼里啪啦的先弄死一堆海族人,然後成了海族人的王,奧姆被綠了,王位被搶。海王還說我是海洋的領主,你怕不是翻譯官的頭頭。海族人也凄慘,打不過啊。

先說優點特效很足!特效很足!特效很足!劇情全程沒有挖坑。但是不知道為什麼!看得不過癮感覺就跟一般,男女主角愛得莫名其妙,感覺亞特蘭蒂斯的女人都有一個特點:喜歡陸地上的男人,不喜歡本土的。挺同情海裡的男人的,自己未婚妻和陸地上的男人跑了,還生了個兒子。把老婆搶回來後不是寵愛,而是生完孩子女兒後,拿去祭獻給醜陋的退化的海怪???女兒長大後上陸地又愛上了同母異父的哥哥???背叛得莫名其妙。最後男主拿到了自己的武器不是因為自己有多勇敢多牛逼,而是因為男主能和海裡的動物對話???那我倒是奇怪了海裡的動物怎麼聽得懂英語。離題了就回來,有點鑽牛角尖了。要我說海神三叉戟就是個大型信號擴散器,幫助擴散命令罷了。

看一下評論時間

對於《海王》我只獲取了4天的數據,看一下大家都在什麼時間進行評論吧,晚上10點以後寫評論的比較多,估計是大家看完電影,回家沒啥事情才開始寫評論吧~~

在這裡插入圖片描述

def analysis4():
    data = clean_data()
    # 獲取時間
    # 添加小時
    data["hour"] = data["startTime"].dt.hour
    data["startTime"] = data["startTime"].dt.date
    need_date = data[["startTime","hour"]]
    def get_hour_size(data):
        hour_data = data.groupby(by="hour")["hour"].size().reset_index(name="count")
        return hour_data
    data = need_date.groupby(by="startTime").apply(get_hour_size)

    data_reshape = data.pivot_table(index="startTime",columns="hour",values="count")

    bar = Bar("分時評論分析",width =1200,height=600,title_pos ="center")
    data_reshape.fillna(0,inplace=True)
    print(data_reshape)
    for index,row in data_reshape.T.iterrows():
        print(data_reshape.index)
        v1 = list(row.values)

        bar.add(str(index)+"時",row.index,v1,is_legend_show=True,legend_pos="80%",legend_text_size=8)

    bar.render("html/1.html")

粉絲分佈

在這裡插入圖片描述

# 處理地名數據,解決坐標文件中找不到地名的問題
def handle(cities):
    # 獲取坐標文件中所有地名
    data = None
    with open(
            'city_coordinates.json文件地址',
            mode='r', encoding='utf-8') as f:
        data = json.loads(f.read())  # 將str轉換為json

    # 迴圈判斷處理
    data_new = data.copy()  # 拷貝所有地名數據
    for city in set(cities):  # 使用set去重
        # 處理地名為空的數據
        if city == '':
            while city in cities:
                cities.remove(city)
        count = 0
        for k in data.keys():
            count += 1
            if k == city:
                break
            if k.startswith(city):
                # print(k, city)
                data_new[city] = data[k]
                break
            if k.startswith(city[0:-1]) and len(city) >= 3:
                data_new[city] = data[k]
                break
        # 處理不存在的地名
        if count == len(data):
            while city in cities:
                cities.remove(city)

    # 寫入覆蓋坐標文件
    with open(
            'city_coordinates.json文件地址',
            mode='w', encoding='utf-8') as f:
        f.write(json.dumps(data_new, ensure_ascii=False))  # 將json轉換為str


def analysis6():


    data = clean_data()
    cities = list(data[~data["cityName"].isnull()]["cityName"].values)
    handle(cities)


    style = Style(
        title_color='#fff',
        title_pos='center',
        width=1200,
        height=600,
        background_color='#404a59'
    )


    new_cities = Counter(cities).most_common()

    geo = Geo("《海王》粉絲分佈","數據來源:CSDN-夢想橡皮擦",**style.init_style)
    attr, value = geo.cast(new_cities)
    geo.add('', attr, value, visual_range=[0, 3500],visual_text_color='#fff', symbol_size=15,is_visualmap=True, is_piecewise=True, visual_split_number=10)
    geo.render('粉絲位置分佈-GEO.html')

詞雲圖

import jieba.analyse
def analysis7():
    data = clean_data()
    contents = list(data["content"].values)
    try:
        jieba.analyse.set_stop_words('stopwords.txt')
        tags = jieba.analyse.extract_tags(str(contents), topK=100, withWeight=True)
        name = []
        value = []
        for v, n in tags:
            # 權重是小數,為了湊整,乘了一萬
            name.append( v)
            value.append( int(n * 10000))
        wordcloud = WordCloud(width=1300, height=620)
        wordcloud.add("", name, value, word_size_range=[20, 100])
        wordcloud.render()
    except:
        print("錯誤")

在這裡插入圖片描述

全是好評啊,特效好看,劇情好看,全程無尿點,DC,海王,溫子仁,女主。
本周末電影院走起。

源碼關註微信公眾號:回覆海王領取


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 資料庫的基本操作 1. 創建資料庫 database_name為要創建的資料庫的名稱 2. 刪除資料庫 database_name為要刪除的資料庫的名稱 3. 資料庫存儲引擎 資料庫存儲引擎是資料庫底層軟體組成,資料庫管理系統(DBMS)使用數據引擎進行創建、查詢、更新和刪除數據操作。 MySQL的 ...
  • [20190401]那個更快的疑問.txt--//前一陣子,做了11g於10g下,單表單條記錄唯一索引掃描的測試,摘要如下:--//參考鏈接:http://blog.itpub.net/267265/viewspace-2636321/http://blog.itpub.net/267265/vie ...
  • 下圖展示了 LEFT JOIN、RIGHT JOIN、INNER JOIN、OUTER JOIN 相關的 7 種用法。 具體分解如下: 1、INNER JOIN(內連接) 2、LEFT JOIN(左連接) 3、RIGHT JOIN(右連接) 4、OUTER JOIN(外連接) 5、LEFT JOIN ...
  • 1.我們使用緩存時的業務流程大概為: 當我們查詢一條數據時,先去查詢緩存,如果緩存有就直接返回,如果沒有就去查詢資料庫,然後返回。這種情況下就可能出現下麵的一些現象。 2.緩存穿透 2.1什麼是緩存穿透 緩存穿透是指查詢一個一定不存在的數據,由於緩存是不命中時被動寫的,並且出於容錯考慮,如果從存儲層 ...
  • 最近做ogg數據同步,然後觸發器加工數據放入另外一張表,由於數據量很大,一分鐘幾萬條數據,由於一些條件欄位類型不匹配,引起ogg阻塞,比較頭大。最後分析發現性能問題。請看下圖: phmxxh是varchar2類型,note_id是integer類型,用to_char轉換以後,性能提高60倍以後註意避 ...
  • 筆記記錄自林曉斌(丁奇)老師的《MySQL實戰45講》 (本篇內圖片均來自丁奇老師的講解,如有侵權,請聯繫我刪除) 14) --count(*)這麼慢,我該怎麼辦? 有時你會發現,隨著系統中記錄數越來越多,select count(*) from t執行得也越來越慢。那麼今天,我們就來聊聊count ...
  • 寫代碼好多年了,發現大家的思路都是寫代碼、寫代碼、寫代碼,還弄了個稱號——碼農。 我是挺無語的,我的思路是——不寫代碼、不寫代碼、不寫代碼! 無聊的代碼為啥要重覆寫呢?甚至一寫寫好幾年。 舉個例子吧,要不然大家肯定很懵。 當我們剛開始學習資料庫編程的時候,我們會先寫一段代碼,實現往一個表裡添加數據的 ...
  • 目錄:zxing->encoding->EncodingHandler類 中修改 createQRCode方法 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...