學習思路: 1.需求是什麼? 2.方案是什麼? 3.邏輯是什麼? 4.開發中的問題?怎麼解決? 整體流量概況: 1.累計用戶量 2.每日新增用戶量 3.每日的訪問人數、次數 4.每日的全部訪問人均次數、時長和深度 5.計算用戶平均會話數 6.計算當日訪問IP數 7.新老用戶訪問占比 8.每日新老用戶 ...
學習思路:
1.需求是什麼?
2.方案是什麼?
3.邏輯是什麼?
4.開發中的問題?怎麼解決?
整體流量概況:
1.累計用戶量
2.每日新增用戶量
3.每日的訪問人數、次數
4.每日的全部訪問人均次數、時長和深度
5.計算用戶平均會話數
6.計算當日訪問IP數
7.新老用戶訪問占比
8.每日新老用戶分佈情況
9.每日新老用戶在各個省下的分佈
10.每個頁面訪問次數分佈
11.每個版本的使用情況
12.訪問終端(app、web、小程式)分佈情況
用戶獲取:
新增用戶量=自然流量+渠道流量
渠道新增用戶量
各個渠道新用戶人均使用時長
各個渠道的新用戶轉化率
異常流量分析
用戶特征:
按地區(省市區)、性別、操作系統、註冊時間、瀏覽器(Chrome、IE、FireFox)
版本的訪問的流量分析
不同版本的人均使用時長
各個版本留存
事件轉化:
新老用戶事件發生次數、人數、人均次數
事件次數分段分佈(0~1)(1~10)(10~50)
技術選型:
1.數據量大小
2.業務需求
3.行業內的經驗
4.技術成熟度
5.開發維護成本
6.總成本預算
組件版本選擇:
1.不要選擇最新的版本
2.最新版本半年前左右的穩定版
3. 3.1.1 3.1.2 3.2
物理機:
128G 20c 40T 8THHD 2TSSD 4W
人、電、物理機:5w
集群服務分配:
1.負載均衡
2.保證服務依賴關係儘可能在同一臺節點上
數倉部署和理解,hive管理