最近ChatGPT蠻火的,今天試著讓ta寫了一篇數據分析實戰案例,大家來評價一下! 一、數據 您的團隊已經為您提供了一些游戲數據,包括玩家的行為和收入情況。以下是數據的一些特征: user_id: 玩家ID date: 游戲日期 level: 玩家達到的游戲等級 revenue: 玩家在游戲中花費的 ...
最近ChatGPT蠻火的,今天試著讓ta寫了一篇數據分析實戰案例,大家來評價一下!
一、數據
您的團隊已經為您提供了一些游戲數據,包括玩家的行為和收入情況。以下是數據的一些特征:
- user_id: 玩家ID
- date: 游戲日期
- level: 玩家達到的游戲等級
- revenue: 玩家在游戲中花費的總收入
- spend: 玩家在游戲中的總支出
二、目標
您的目標是分析數據,以回答以下問題:
- 游戲的DAU(日活躍用戶數)是多少?
- 用戶的等級分佈情況是怎樣的?
- 用戶的付費率是多少?
- 游戲的收入情況如何?
- 付費用戶的ARPU(平均收入每用戶)是多少?
三、解決方案
為了回答上述問題,我們可以使用Python的各種庫和工具來進行數據分析和可視化。
首先,我們需要載入數據。以下是我們將使用的Python庫:
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns
我們可以使用pandas庫中的read_csv()方法載入數據:
data = pd.read_csv("game_data.csv")
1. DAU
為了回答第一個問題,我們可以使用以下代碼來計算游戲的DAU:
dau = data['user_id'].nunique() print("游戲的DAU是:", dau)
2. 用戶等級分佈
為了回答第二個問題,我們可以使用以下代碼來繪製用戶等級分佈圖:
level_counts = data['level'].value_counts() plt.figure(figsize=(10,5)) sns.barplot(level_counts.index, level_counts.values, alpha=0.8) plt.title('用戶等級分佈') plt.ylabel('用戶數量', fontsize=12) plt.xlabel('等級', fontsize=12) plt.show()
3. 付費率
為了回答第三個問題,我們可以使用以下代碼計算游戲的付費率:
paying_users = data[data['revenue'] > 0]['user_id'].nunique() total_users = data['user_id'].nunique() paying_rate = paying_users / total_users print("游戲的付費率是:", paying_rate)
4. 收入情況
為了回答第四個問題,我們可以使用以下代碼計算游戲的收入情況:
revenue = data['revene'].sum() spend = data['spend'].sum() plt.figure(figsize=(5,5)) labels = ['總收入', '總支出'] sizes = [revenue, spend]#[Python學習交流群:748989764] colors = ['#99ff99', '#ff9999'] plt.pie(sizes, labels=labels, colors=colors, autopct='%1.1f%%', startangle=90) plt.axis('equal') plt.show()
5. 付費用戶的ARPU
為了回答第五個問題,我們可以使用以下代碼計算付費用戶的ARPU:
paying_users = data[data['revenue'] > 0]['user_id'].nunique() total_revenue = data['revenue'].sum() arpu = total_revenue / paying_users print("付費用戶的ARPU是:", arpu)