資料庫簡單的實際運用 ②

来源:http://www.cnblogs.com/zpfbuaa/archive/2016/04/29/5447549.html
-Advertisement-
Play Games

文章講述了對於數據量較少的處理。包括新建資料庫、使用SQL語言建表、向資料庫中導入數據、簡單的數據查詢操作等。下麵介紹一個相對上一個較為複雜的資料庫。其實也就是數據量增大了點,數據處理要求多了些,運用基礎的資料庫知識以及網上的各種講解都可以掌握這些處理方法。 例2 下麵列舉某寶一些數據處理。 Tab ...


文章講述了對於數據量較少的處理。包括新建資料庫、使用SQL語言建表、向資料庫中導入數據、簡單的數據查詢操作等。下麵介紹一個相對上一個較為複雜的資料庫。其實也就是數據量增大了點,數據處理要求多了些,運用基礎的資料庫知識以及網上的各種講解都可以掌握這些處理方法。

例2

 下麵列舉某寶一些數據處理。

Table 1: Online user behavior before Dec. 2015. (ijcai2016_taobao)

Field

Description

User_id

unique user id

Seller_id

unique online seller id

Item_id

unique item id

Category_id

unique category id

Online_Action_id

“0” denotes “click” while “1” for “buy”

Time_Stamp

date of the format “yyyymmdd”

 

統計內容:

  • 用戶計數特征
  1. 用戶總交互次數,用戶點擊次數,用戶購買次數
  2. 用戶交互、點擊、購買的不同商品種類數
  3. 用戶交互、點擊、購買的不同商品數
  • 用戶時間層級(預測時間為20151201)
  1. 最近1天/3天/10天用戶對商品的交互/點擊/購買數
  2. 最近1天/3天/10天用交互的不同商品種類總數
  3. 用戶周末(周五六日)對商品的交互、點擊、購買次數
  • 用戶比值特征
  1. 用戶點擊到購買商品的轉化率
  2. 用戶周末點擊、購買占總點擊、購買的比值
  • 商品計數特征
  1. 被點擊、被購買次數最多的前5商品
  2. 商品被點擊、購買的平均時間間隔

提交結果:

  1. 用戶表

1

user_id

2

用戶交互次數

3

點擊次數

4

購買次數

5

交互不同商品數

6

點擊不同商品數

7

購買不同商品數

8

交互不同商品種類數

9

點擊不同商品種類數

10

購買不同商品種類數

11

最近1天用戶對商品的交互數

12

最近1天用戶對商品的點擊數

13

最近1天用戶對商品的購買數

14

最近3天用戶對商品的交互數

15

最近3天用戶對商品的點擊數

16

最近3天用戶對商品的購買數

17

最近10天用戶對商品的交互數

18

最近10天用戶對商品的點擊數

19

最近10天用戶對商品的購買數

20

周末用戶對商品的交互數

21

周末用戶對商品的點擊數

22

周末用戶對商品的購買數

23

用戶點擊到購買商品的轉化率

24

用戶周末點擊、購買占總點擊、購買的比值

 

  1. 商品表

 

1

item_id

2

商品被點擊平均時間間隔

3

商品被購買平均時間間隔

 

實現工具:SQL Server 2014 、基本的數據

1.這裡我們可以和例1不同,可以先將淘寶的數據導入到資料庫中,但是你也許會問:表都沒有建立數據導入到哪裡呢?其實如果在例1中的導入數據時候認真觀察的話,可以發現當我們將excel導入時候,會有一個預設的表,並且這個表的名字和我們導入的excel的表名字相同(通常情況下,為Sheet),所以我們這裡就直接導入數據了哦。

 

2.修改表的列名

3.檢驗數據是否成功導入

 

use 淘寶

SELECT *
FROM dbo.taobao

 

4.完成前面的4項要求(註意Online_Action_id=1 或 0 代表不同含義

  1. 用戶表

1

user_id

2

用戶交互次數

3

點擊次數

4

購買次數

use 淘寶

select A.User_id, click as 點擊次數,buy as 購買次數, click+buy as 用戶交互次數
from(
    select user_id,count(Online_Action_id)  click
    from taobao
    where Online_Action_id=0
    group by user_id) as A
join
    (select user_id,count(Online_Action_id)  buy
    from taobao
    where Online_Action_id=1
    group by user_id)as B
on A.user_id=B.user_id

5.完成要求5~7

5

交互不同商品數

6

點擊不同商品數

7

購買不同商品數

use 淘寶

select A.user_id,click as 點擊不同商品數 ,buy as 購買不同商品數,click+buy as 交互不同商品數
from(
    select user_id,count(Item_id)  click
    from taobao
    where Online_Action_id=0
    group by user_id) as A
join
    (select user_id,count(Item_id)  buy
    from taobao
    where Online_Action_id=1
    group by user_id)as B
on A.user_id=B.user_id

 

6.完成要求8~10(註意關鍵字DISTINCT 的使用)

8

交互不同商品種類數

9

點擊不同商品種類數

10

購買不同商品種類數

 

use 淘寶

select A.user_id,click as 點擊不同商品種類數 ,buy as 購買不同商品種類數,click+buy as 交互不同商品種類數
from(
    select user_id,count(DISTINCT Item_id)  click
    from taobao
    where Online_Action_id=0
    group by user_id) as A
join
    (select user_id,count(DISTINCT Item_id)  buy
    from taobao
    where Online_Action_id=1
    group by user_id)as B
on A.user_id=B.user_id

 7.完成要求11~19(只是天數的改變因此相當於只有三項任務 這裡用<2 或<4或<11 是因為<的操作效率比<=要高!)

至於詳細講解見博客http://blog.chinaunix.net/uid-20586655-id-3406139.html

 DATEDIFF(D,CONVERT(date,time_stamp,110),convert(date,'20151201',110))<2 

至於這個函數的作用:詳情見http://www.w3school.com.cn/sql/func_datediff.asp

10

購買不同商品種類

11

最近1天用戶對商品的交互數

12

最近1天用戶對商品的點

13

最近1天用戶對商品的購買

14

最近3天用戶對商品的交互數

15

最近3天用戶對商品的點

16

最近3天用戶對商品的購買

17

最近10天用戶對商品的交互數

18

最近10天用戶對商品的點

19

最近10天用戶對商品的購買

use 淘寶

SELECT A.user_id ,click as 最近1天用戶對商品的點擊數 ,buy as 最近1天用戶對商品的購買數,click+buy as 最近1天用戶對商品的交互數
FROM 
    (SELECT User_id ,count(Online_Action_id)  click
    fROM dbo.taobao
    WHERE  Online_Action_id=0 AND DATEDIFF(D,CONVERT(date,time_stamp,110),convert(date,'20151201',110))<2
    GROUP BY User_id)A
join
    (SELECT User_id ,count(Online_Action_id)  buy
    FROM dbo.taobao
    WHERE Online_Action_id=1 AND DATEDIFF(D,CONVERT(date,time_stamp,110),convert(date,'20151201',110))<2
    GROUP BY User_id)B
ON A.user_id=B.user_id

給出完整的11~19查詢語句

use 淘寶
SELECT A.user_id ,click as 最近1天用戶對商品的點擊數 ,buy as 最近1天用戶對商品的購買數,click+buy as 最近1天用戶對商品的交互數
from 
(SELECT User_id ,count(Online_Action_id)  click
from dbo.taobao
Where  Online_Action_id=0 AND DATEDIFF(D,CONVERT(date,time_stamp,110),convert(date,'20151201',110))<2
Group By User_id)A
Join
(SELECT User_id ,count(Online_Action_id)  buy
from dbo.taobao
Where  Online_Action_id=1 AND DATEDIFF(D,CONVERT(date,time_stamp,110),convert(date,'20151201',110))<2
Group By User_id)B
on A.user_id=B.user_id

SELECT A.User_id ,click as 最近3天用戶對商品的點擊數 ,buy as 最近3天用戶對商品的購買數,click+buy as 最近3天用戶對商品的交互數
from 
(SELECT User_id ,count(Online_Action_id)  click
from dbo.taobao
Where  Online_Action_id=0 AND DATEDIFF(D,CONVERT(date,time_stamp,110),convert(date,'20151201',110))<4
Group By User_id)A
Join
(SELECT User_id ,count(Online_Action_id)  buy
from dbo.taobao
Where  Online_Action_id=1 AND DATEDIFF(D,CONVERT(date,time_stamp,110),convert(date,'20151201',110))<4
Group By User_id)B
on A.user_id=B.user_id


SELECT A.User_id ,click as 最近10天用戶對商品的點擊數 ,buy as 最近10天用戶對商品的購買數,click+buy as 最近10天用戶對商品的交互數
from 
(SELECT User_id ,count(Online_Action_id)  click
from dbo.taobao
Where  Online_Action_id=0 AND DATEDIFF(D,CONVERT(date,time_stamp,110),convert(date,'20151201',110))<11
Group By User_id)A
Join
(SELECT User_id ,count(Online_Action_id)  buy
from dbo.taobao
Where  Online_Action_id=1 AND DATEDIFF(D,CONVERT(date,time_stamp,110),convert(date,'20151201',110))<11
Group By User_id)B
on A.user_id=B.user_id

8.完成要求20~22(註意我們的每周第一天和美國的每周第一天是不同的,

所以開始要使用語句SET DATEFIRST 1設置第一天為周一)

在這裡的DATEPART(dw,CONVERT(date,time_stamp,110))

參看http://www.w3school.com.cn/sql/func_datepart.asp講解

 

20

周末用戶對商品的交互數

21

周末用戶對商品的點

22

周末用戶對商品的購買

use 淘寶
set DATEFIRST 1
SELECT A.User_id ,click as 周末用戶對商品的點擊數 ,buy as 周末用戶對商品的購買數,click+buy as 周末用戶對商品的交互數
FROM
    (SELECT USER_id,Count(online_action_id) click
    FROM taobao
    WHERE online_action_id =0
    AND DATEPART(dw,CONVERT(date,time_stamp,110))in(5,6,7)
    GROUP BY User_id)A
join
    (SELECT USER_id,Count(online_action_id) buy
    FROM taobao
    WHERE online_action_id =1
    AND DATEPART(dw,CONVERT(date,time_stamp,110))in(5,6,7)
    GROUP BY User_id)B
ON A.user_id = B.user_id

 9.完成要求23

函數ltrim(Convert(numeric(9,2),buy*100.0/(click+buy)))+'%'as 用戶點擊到購買商品的轉化率 

詳情見https://msdn.microsoft.com/zh-cn/library/ms177827.aspx

23

購買商品的化率

 

use 淘寶

SELECT A.user_id,buy,click ,ltrim(Convert(numeric(9,2),buy*100.0/(click+buy)))+'%' as 用戶點擊到購買商品的轉化率
FROM 
    (SELECT USER_id,Count(online_action_id) click
    FROM taobao
    WHERE online_action_id =0
    AND DATEPART(dw,CONVERT(date,time_stamp,110))in(5,6,7)
    GROUP BY User_id)A
join
    (SELECT USER_id,Count(online_action_id) buy
    FROM taobao
    WHERE online_action_id =1
    AND DATEPART(dw,CONVERT(date,time_stamp,110))in(5,6,7)
    GROUP BY User_id)B
ON A.user_id = B.user_id

 

 

10.完成要求24(對於這個要求可以利用前面的周末點擊以及周末購買除以總點擊、總購買)

24

周末點購買購買的比

 

那麼關鍵問題是我們該怎麼將之前分開的查詢操作統一在一起完成一個查詢操作呢。

現在放出我們的大招

使用with 可以將我們的查詢語句寫在一起,並且可以將一堆的查詢語句進行重命名,之後只需要使用這個重命名就可以了。具體操作見下麵的例子

use 淘寶;
set datefirst 1;//加上分號
with cnt_action as(
select a.User_id, click as 點擊次數,buy as 購買次數, click+buy as 用戶交互次數
from(
select user_id,count(Online_Action_id)  click
from taobao
where Online_Action_id=0
group by user_id)A
join
(select user_id,count(Online_Action_id)  buy
from taobao
where Online_Action_id=1
group by user_id)B
on A.user_id=B.user_id	   

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ➠更多技術乾貨請戳:聽雲博客 Charles是一款抓包修改工具,相比起TcpDump,charles具有界面簡單直觀,易於上手,數據請求控制容易,修改簡單,抓取數據的開始暫停方便等等優勢!前面介紹瞭如何使用TcpDump抓包,下麵給大家介紹一下Charles的使用。 Charles抓包 Charle ...
  • 作為一種輕量級的數據交換格式,json正在逐步取代xml,成為網路數據的通用格式。 有的json代碼格式比較混亂,可以使用此“http://www.bejson.com/”網站來進行JSON格式化校驗(點擊打開鏈接)。此網站不僅可以檢測Json代碼中的錯誤,而且可以以視圖形式顯示json中的數據內容 ...
  • 1、原來是將EditView放到了popupwindow,發現EditView原有的複製、粘貼、全選、選擇功能失效了,所以便用DialogFragment代替了popupWindow 直接上代碼 ①、先看佈局文件 ②、看自定義diaglogFragment的代碼 3、如何使用 效果圖 ...
  • 1.Socket 幾個常用的名詞 IPC—>Inter Process Communication,進程間通信 socket —> 套接字 TCP—>Transmission Control Protocol傳輸控制協議, 什麼是Socket Socket:又稱作是套接字,網路上的兩個程式通過一個雙 ...
  • Web和Native的交互,也就是iOS object-C與Javascript之間的交互;核心代碼是 [webView stringByEvaluatingJavaScriptFromString:@"xxxxxxxxxx"]; 這裡主要用到的就是iOS WebKit載入網路頁面,功能有獲取用戶位 ...
  • 控制項屬性: android屬性 Android功能強大,界面華麗,但是眾多的佈局屬性就害苦了開發者,下麵這篇文章結合了網上不少資料, 第一類:屬性值為true或falseandroid:layout_centerHrizontal 水平居中 (Hrizontal表示水平)android:layout ...
  • 在很多地方都有人提到MySQL這個數據,之前沒有接觸過的mysql資料庫的童鞋們可以跟我一起走進mysql的世界。 http://hovertree.com/menu/mysql/ 安裝我就不多說了,都是傻瓜的安裝。 安裝好了之後就可以看到服務里多了個服務。 當然要啟動它。 根據自己的需要設置成自動 ...
  • 很多人習慣用ORACLE的DBCA工具創建、刪除資料庫,這裡總結一下手工刪除資料庫實驗的步驟,文中大量參考了樂沙彌的手動刪除ORACLE資料庫這篇博客的內容,當然還有Oracle官方相關文檔。此處實驗環境為Oracle Linux Server release 5.7,資料庫版本為10.2.0.5.... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...