鏈接:http://china.nba.com/playerindex/ 所需獲取JSON數據頁面鏈接:http://china.nba.com/static/data/league/playerlist.json 數據來源:NBA中國官網 庫: requests 用於解析頁面文本數據 pandas ...
鏈接:http://china.nba.com/playerindex/
所需獲取JSON數據頁面鏈接:http://china.nba.com/static/data/league/playerlist.json
數據來源:NBA中國官網
庫:
requests 用於解析頁面文本數據
pandas 用於處理數據
時間:
2017/2/17 (因為為現役球員,故需註明時間節點)
開工:
得到了數據,這下就好辦了
先上簡單粗暴夠用的代碼
import requests 2 import pandas as pd 3 user_agent = 'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)' 4 headers = {'User-Agent':user_agent} 5 url='http://china.nba.com/static/data/league/playerlist.json' 6 #解析網頁 7 r=requests.get(url,headers=headers).json() 8 num=int(len(r['payload']['players']))-1 #得到列表r['payload']['players']的長度 9 p1_cols=[] #用來存放p1數組的列 10 p2_cols=[] #用來存放p2數組的列 11 #遍歷其中一個['playerProfile'],['teamProfile'] 得到各自列名,添加到p1_cols和p2_cols列表中 12 for x in r['payload']['players'][0]['playerProfile']: 13 p1_cols.append(x) 14 for y in r['payload']['players'][0]['teamProfile']: 15 p2_cols.append(y) 16 p1=pd.DataFrame(columns=p1_cols) #初始化一個DataFrame p1 用來存放playerProfile下的數據 17 p2=pd.DataFrame(columns=p2_cols) #初始化一個DataFrame p1 用來存放playerProfile下的數據 18 #遍歷一次得到一個球員的信息,分別添加到DataFrame數組中 19 for z in range(num): 20 player=pd.DataFrame([r['payload']['players'][z]['playerProfile']]) 21 team=pd.DataFrame([r['payload']['players'][z]['teamProfile']]) 22 p1=p1.append(player,ignore_index=True) 23 p2=p2.append(team,ignore_index=True) 24 p3=pd.merge(p1,p2,left_index=True,right_index=True) #數據合併 25 p3.to_csv('f://NBA//nba_player.csv',index=False)
只能說簡單粗暴,25行代碼搞定,恩,不過數據已經拿到手。
接下來查看一下
數據量不大,也可以用EXCEL來'偷窺'
拿到數據,總得稍微把玩一下,才對得起這堆數據,不然和撩到了步行街標準9分妹子就分手有什麼區別呢?
瞭解下基本的數據情況
截止全明星賽前有449名現役球員
那麼各球隊球員數量具體是多少呢?
老詹的騎士還差個控位,湖人在為明年做準備
很想瞭解下NBA球員國籍'country'的情況
也就是說449名現役大名單球員里,有340名美國佬咯,螺旋穩
其中,
亞洲帥哥2枚,喬治亞的Zaza Pachulia 和 以色列的Omri Casspi 撐場
非洲在大帝的領導下,率將領14名出征,NBA官網上28卡國籍是剛果。
歐洲55人;大洋洲8人(澳大利亞7人,紐西蘭1人);南美12人;還有4人,暫且未知(NBA資料庫未補充)
接下來,看一下現役球員中,每一屆球員的情況
98屆的 Vince Carter,Paul Pierce,Dirk Nowitzki
99屆的Manu Ginobili,Jason Terry,Metta World Peace
00屆的Jamal Crawford,Mike Miller
01屆的Tyson Chandler,Pau Gasol,Richard Jefferson,Joe Johnson,Tony Parker,Zach Randolph
02屆的Matt Barnes,Mike Dunleavy,Udonis Haslem,Nene,Luis Scola
終有一天他們會離去,就像去年夏天的Tim,Bryant 和 Kevin
還是那句話,老兵不死,只是凋零。
03白金一代也只有12人在戰鬥了,當安東尼頂替樂福進入16/17/全明星賽時,老詹說自己不再是年齡最大的那位了,當時的你又在想啥呢?
這裡我們需要再看一項數據,就是NBA現役球員的NBA平均職業生涯年齡是多少呢?
現役球員平均職業年齡為4.76年。
新生代球員配上新時代的體系及打法,NBA也是越來越好看,越來越激烈。每一位成功的球員都是為那個時代而生的。
下麵,我們看一個很有意思的數據
現役NBA球員,最受歡迎的號碼前5是哪幾個號碼呢?
只能說,666。原來5號,8號這麼受歡迎。
還有,我們平時看NBA,主播評論員都是只說美國人的lastName,所以有時候一個隊有幾個湯普森或者約翰遜,滿臉茫然
朋友,我會告訴你,共有7個約翰遜,統統來自美國。東部4個約翰遜,西部3個約翰遜。
熱火VS快船比賽解說可能就是,約翰遜外線傳球給約翰遜被殺出來的約翰遜搶斷成功,掩耳不及迅雷之勢傳給快下的約翰遜,輕鬆扣籃得手。
那球員的位置分佈怎麼樣呢?小球時代,自我感覺整個聯盟後場球員會遙遙領先前場球員,一起來看看,果不其然。
今天就聊到這裡吧
還有許多有趣的欄位,有待開發。無兄弟,不籃球,期待與大伙一起為了我們興趣,一起討論交流,
I am a JRS,We are family ,他強任他強。
小白一枚,能力有限,做的不好的地方,尤其是邏輯與思維上的東西,需要大神們看到了多多指教和斧正buddyquan。
小白博客:https://home.cnblogs.com/u/buddyquan/ QQ:1749061919 小白爬蟲求帶