爬取B站彈幕並且製作詞雲_ZenDei技術網路在線

爬取B站彈幕並且製作詞雲

-Advertisement-

爬取彈幕 1. 從手機埠進入網頁爬取找到介面 2.代碼 import requests from lxml import etree import numpy as np url='https://api.bilibili.com/x/v1/dm/list.so?oid=198835779' he ...

爬取彈幕
- 1. 從手機埠進入網頁爬取找到介面
- 2.代碼
製作詞雲
- 1.文件讀取
- 2.代碼

爬取彈幕

1. 從手機埠進入網頁爬取找到介面

2.代碼

import requests
from lxml import etree
import numpy as np
url='https://api.bilibili.com/x/v1/dm/list.so?oid=198835779'
headers= {
    'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Mobile Safari/537.36',
     }
response = requests.get(url,headers= headers)
# response.encoding='utf-8'
# print(response.text)
# print(response.content)
print(type(response.text))
html=etree.HTML(response.content)
t=etree.tostring(html)
# print(t)
words = html.xpath('/html//d/text()')
with open('word.txt','w')as f:
    for word in words:
        f.write(word+' ')
print(words)

每一次的都是不同的彈幕所以不用擔心彈幕數量過少

製作詞雲

利用的是wordcloud庫

1.文件讀取

2.代碼

#coding:utf-8


from matplotlib import pyplot as plt
from wordcloud import WordCloud
import jieba
f=open(r'word.txt','r',encoding='gbk').read()
font = r'C:\Windows\Fonts\FZSTK.TTF'

cloud=WordCloud(
    font_path=font,
    width=1000,
    height=800,
    margin=2
).generate(f)

plt.imshow(cloud)
plt.axis('off')
plt.show()

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

談談我對C# 多態的理解

面向對象三要素：封裝、繼承、多態。封裝和繼承，這兩個比較好理解，但要理解多態的話，可就稍微有點難度了。今天，我們就來講講多態的理解。我們應該經常會看到面試題目：請談談對多態的理解。其實呢，多態非常簡單，就一句話：調用同一種方法產生了不同的結果。具體實現方式有三種。一、重載重載很簡單。 p ...
為何要搭建港股交易平臺？

為什麼要搭建港股交易平臺？那就要問股民們為什麼會選擇港股進行投資了？一般的股民可能有人會說：還能為啥啊？賺錢唄！！！但是選擇投資港股，卻可能不是簡單的賺錢這麼簡單。可能很多人並不瞭解香港市場，畢竟這是一個境外市場，運作機制和操作風格都和我們熟悉的A股有很大的不同。與A股相比，港股的優勢是比較明顯的 ...
基於領域驅動設計(DDD)超輕量級快速開發架構

smartadmin.core.urf 這個項目是基於asp.net core 3.1(最新)基礎上參照領域驅動設計（DDD）的理念，並參考目前最為了流行的abp架構開發的一套輕量級的快速開發web application 技術架構,專註業務核心需求，減少重覆代碼，開始構建和發佈，讓初級程式員也能開 ...
05、MyBatis 緩存

1.MyBatis緩存 MyBatis 包含一個非常強大的查詢緩存特性,它可以非常方便地配置和定製.緩存可以極大的提升查詢效率. 1).一級緩存 public Employee getEmpById(Integer id); <select id="getEmpById" resultType="c ...
jsp中el表達式調用java的參數

今天在jsp頁面中使用了EL表達式，同時EL表達式在for迴圈中，但是EL表達式無法與java代碼同時使用，所以記錄一下如何把java中的變數傳遞過去。示例： <% for(int i=0;i<list.size();i++){ %> <tr> <td>${list[i].key1}</td> < ...
day7__基礎(python基礎數據類型補充以及編碼的進階)

一、基礎數據類型補充內容 1、字元串 s1 = 'taobao jD shopping' print(s1.capitalize()) #首字母大寫，其餘小寫 print(s1.swapcase()) #大小寫翻轉 print(s1.title()) #每個單詞的首字毒大寫 ret2 = s1.ce ...
SSM整合02_純註解方式

本教程源碼請訪問：tutorial_demo SSM整合可以使用多種方式，我們純註解的方式，拋棄所有的xml配置文件（包括web.xml），使用Java配置類和註解進行配置。 SSM的整體思路：整合Spring和SpringMVC，整合Spring和MyBatis，兩兩整合。一、環境準備 1.1、 ...
SSM整合01_XML和註解方式

本教程源碼請訪問：tutorial_demo SSM整合可以使用多種方式，我們採用XML+註解的方式 SSM的整體思路：整合Spring和SpringMVC，整合Spring和MyBatis，兩兩整合。一、環境準備 1.1、建庫建表 DROP DATABASE IF EXISTS ssm; CRE ...