Python採集主播照片，實現人臉識別, 進行顏值評分，製作顏值排行榜

-Advertisement-

昨晚一回家，表弟就神神秘秘的跟我說，發現一個高顏值網站，非要拉著我研究一下她們的顏值高低。我心想，這還得要我一個個慢慢看，太麻煩了~ 於是反手用Python給他寫了一個人臉識別代碼，把她們的照片全部爬下來，自動檢測顏值打分排名。這不比手動快多了？準備工作開發環境 Python 3.8 Pyc ...

昨晚一回家，表弟就神神秘秘的跟我說，發現一個高顏值網站，非要拉著我研究一下她們的顏值高低。

我心想，這還得要我一個個慢慢看，太麻煩了~

於是反手用Python給他寫了一個人臉識別代碼，把她們的照片全部爬下來，自動檢測顏值打分排名。

這不比手動快多了？

準備工作

開發環境

Python 3.8
Pycharm

模塊使用

requests >>> pip install requests
tqdm >>> pip install tqdm 簡單實現進度條效果
os 文件操作
base64

照片採集部分

流程思路

明確需求:
分析主播照片能夠去哪裡獲取到 <開發者工具抓包分析圖片數據來源>
- 打開開發者工具: F12
- 刷新網頁
- 點擊 Img 查看圖片鏈接地址
- 通過關鍵字去搜索圖片所對應的數據包
在這個鏈接裡面就有想要圖片數據內容
- 發送請求, 模擬瀏覽器對於url地址發送請求
- 獲取數據, 獲取伺服器返迴響應數據
- 解析數據, 提取我們想要的內容圖片url 和主播名字
- 保存數據, 把圖片數據內容保存本地文件夾裡面

代碼展示

# 導入數據請求模塊
import requests
"""
發送請求, 模擬瀏覽器對於url地址發送請求
"""
# 模擬瀏覽器  headers 請求頭 --> 字典數據類型, 構建完整鍵值對
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/113.0.0.0 Safari/537.36'
}
# 請求鏈接
url = 'https://www.huya.com/cache.php?m=LiveList&do=getLiveListByPage&gameId=1663&tagAll=0&page=2'
# 發送請求
# 調用requests模塊裡面get請求方法, 對於url地址發送請求並且攜帶上headers請求頭偽裝, 最後用response變數接受返回數據
response = requests.get(url=url, headers=headers)
# <Response [200]> 響應對象, 200狀態碼表示請求成功
print(response)
"""
- 獲取數據, 獲取伺服器返迴響應數據
    response.text 獲取響應文本數據 <字元串數據>
    response.json() 獲取響應json字典數據 <字典數據>

- 解析數據, 提取我們想要的內容 圖片url 和 主播名字
    解析數據方法選擇, 是根據返回數據內容來的
        鍵值對取值 <字典取值>
"""
# for迴圈遍歷提取內容
for index in response.json()['data']['datas']:
    # 照片
    img = index['screenshot']
    # 名字
    name = index['nick']
    """
    保存數據
    """
    content = requests.get(url=img, headers=headers).content
    with open('img\\' + name + '.jpg', mode='wb') as f:
        f.write(content)
    print(name, img)

採集到的照片

評分排名部分

對於照片內容進行人臉檢測, 顏值評分:

百度雲API介面 --> 有現成文檔代碼
通過文檔提供代碼先獲取 access_token

代碼部分

import time
# encoding:utf-8
import requests
import base64
from pprint import pprint
import os
from tqdm import tqdm
# 文章不理解的話，我還錄製了對應的視頻講解，和代碼一起打包好了。
# 都放在這個q裙了：708525271

 
def Score(file):
    # client_id 為官網獲取的AK， client_secret 為官網獲取的SK
    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=官網獲取的AK&client_secret=官網獲取的SK'
    response = requests.get(host)
    access_token = response.json()['access_token']
    '''
    人臉檢測與屬性分析
    '''
    # 讀取一下圖片數據
    f = open(file, mode='rb')
    # 轉成 BASE64格式
    img_base = base64.b64encode(f.read())
    request_url = "https://aip.baidubce.com/rest/2.0/face/v3/detect"
    params = {
        # 傳入圖片BASE64格式
        "image":img_base,
        # 指定圖片數據類型
        "image_type": "BASE64",
        # 檢測類型 檢測顏值評分
        "face_field": "beauty"
    }
    request_url = request_url + "?access_token=" + access_token
    headers = {'content-type': 'application/json'}
    json_data = requests.post(request_url, data=params, headers=headers).json()
    # KeyError: 'result' 因為識別失敗了
    try:
        num = json_data['result']['face_list'][0]['beauty']
        # print('顏值分數是:', num)
        return num
    except:
        return '識別失敗'
 
lis = []
# 讀取文件路徑
files = os.listdir('img\\')
print('正在顏值檢測中, 請稍後......')
for file in tqdm(files):
    time.sleep(0.5)
    filename = f'img\\{file}'
    # 主播名字
    name = file.split('.')[0]
    # 評分
    num = Score(file=filename)
    if num != '識別失敗':
        dit = {
            '主播': name,
            '顏值': num
        }
        lis.append(dit)
 
lis.sort(key=lambda x:x['顏值'], reverse=True)
page = 1
for li in lis:
    print(f'顏值排名第{page}的是{li["主播"]}, 顏值評分是{li["顏值"]}')
    page += 1

效果展示

好了文章內容就分享到這裡，下次見~

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

3、Spring之入門案例

## 3.1、創建module #### 3.1.1、右擊project，創建新module ![image](https://img2023.cnblogs.com/blog/2052479/202307/2052479-20230725081202352-22924479.png) ### 3. ...
【go語言】2.1.1 變數，常量和數據類型

# 包 go程式由一個個不同的包組成，程式的入口是名為main的包，比如我們創建一個main文件 main.go ```go package main import "fmt" func main(){ fmt.Println("hello") } ``` go要求每一個go文件的非註釋開頭必須是` ...
c語言學習9

到目前為止，我們只討論了使用Docker來部署應用程式。然而，Docker也是一個極好的用於開發應用程式的工具。可以採用一些不同的建議來改善開發體驗。 - 在應用程式中使用`docker-compose`以方便開發。 - 使用綁定掛載將本地代碼掛載到容器文件系統中，以避免每次更改都需要重新構建容器映 ...
java線程詳解

# java線程詳解 ## 線程 ### 概念說到線程，就不得不提進程，為什麼呢，因為進程是操作系統進行分配資源和調度的最小單位，比如windows系統安裝的應用軟體（office、qq、微信等）啟動時，由操作系統協調分配資源和調度執行稱之為一個進程，進程間是相互獨立和隔離的。而線程是進程最小執行 ...
JDBC p2 JDBC API

# JDBC API ## 獲取資料庫連接5種方式 1. 通過new創建Driver對象； 2. 使用反射載入Driver類，動態載入，減少依賴性，更加靈活； 3. 使用DriverManager 替代 Driver 進行統一管理，有了更好的擴展性； 4. 使用 Class.forName 自動完成 ...
Java中代碼Bug記錄--泛型失效、數組刪除、HashMap死迴圈

最近在工作的過程中，遇到了不少奇怪自己或者同事的Bug，都是一些出乎意料的，不太容易發現的，記錄一下來幫助可能也遇到了這些Bug的人 # 1. 編譯時泛型校驗失效 ```java Map nameToType = new HashMap(); nameToType.put( "testName", ...
20.1K Star！Notion的開源替代方案：AFFiNE

Notion這款筆記軟體相信很多開發者都比較熟悉了，很多讀者，包括我自己都用它來記錄和管理自己的筆記。今天給大家推薦一個最近比較火的開源替代方案：AFFiNE。目前該開源項目已經斬獲20.1K Star，熱度非常的高，下麵一起來認識一下這個繼Notion之後，被熱捧的開源軟體吧。 ![](https ...
python基礎之函數的特性

### 1.eval() 功能描述：“剝去字元串的外衣”，去運行字元串裡面的代碼作用　：（1）參數是一個類似"1+3"這樣數學表達式的字元串，可以計算得到返回值（int型）（2）參數是一個類似"{'name':'tian','age':18}"這樣字典、列表、元組外套上一對引號的字元串，可以快 ...