企業數據資產 有了大數據的光環,有了從數據中挖掘商業價值的方法和工具之後,那些原本存放在伺服器上平淡無奇的陳年舊數一夜之間身價倍增。按照世界經濟論壇報告的看法,“大數據為新財富,價值堪比石油"。《大數據時代》一書的作者維克托則樂觀地預測,數據列人企業資產負債表只是時間問題。 本質上,任何企業在生產活 ...
企業數據資產
有了大數據的光環,有了從數據中挖掘商業價值的方法和工具之後,那些原本存放在伺服器上平淡無奇的陳年舊數一夜之間身價倍增。按照世界經濟論壇報告的看法,“大數據為新財富,價值堪比石油"。《大數據時代》一書的作者維克托則樂觀地預測,數據列人企業資產負債表只是時間問題。
本質上,任何企業在生產活動中都會產生數據,數據都有分析的價值。我們來看看典型的運營商會產生哪些數據
圖1.2是典型的運營商產生的數據,從下到上分為如下幾類。
Network Raw Data:電信網路里任何一個呼叫或者上網行為都會引起電信設備之間的數據進行交換,這個數據就是網路底數據。
User Plane Detail Record Data:從網路原始數據裡面提取出來的用戶行為數據,如打電話數據、上網行為等。
MR/CHR Type Data:無線測量數據、呼叫歷史記錄單據數據。用戶的位置信息就是從MR/CHR 數據裡面通過演算法得出的。
Signaling Data:信令數據。電信網路分控制面、數據面、用戶面。在控制面上設備之間相互按照協議協商通信的數據叫信令數據。
CRM Billing:電信設備廠商登記的開戶信息、賬單信息。
上面的劃分是從非常專業化的角度進行的,其實通俗一點可以簡單歸類為設備數據和用戶數據兩類。設備數據用來分析設備的正常與否,用於設備的維護、規劃等。用戶數據包括如下數據。
位置數據:無線是用一個個蜂窩來劃分區域的,一個蜂窩叫一個小區,所以只要電話線上,就需要註冊到一個個小區中去,知道了小區就知道了用戶所在的位置。通過小區切換就能計算出用戶移動的軌跡,這就是用戶的位置數據
上網數據:用戶通過運營商的設備上網,所有的行為數據都可以被記錄下來,如上了什麼網站、網速是多少、上了多長時間。這些通過通信協議的包頭就可以獲取。如果繼續分析內容,就可以獲取更多的數據,就可以完全知道用戶在乾什麼。
Note . In a typical network Of、30M subscribers and the data flow around IT引S.
MR℃HR Measurement Repott/CaIl History Data generated during calls
圖1.2
用戶興趣數據:通過用戶的上網記錄,就可以衍生出用戶的興趣愛好、常上什麼網站、最近關註什麼東西等。
通信數據和社交數據:例如,用戶給誰打了電話、打了多長時間、給誰發了簡訊,這些信息都可以被記錄下來。通過電話聯繫又可以衍生出用戶的社交關係數據,如和誰是熟人、常聯繫誰等。
身份信息數據:用戶到運營商開戶,用戶的所有個人信息就被運營商記錄下來,包括姓名、年齡、身份證號碼等。而且這些數據是由人工採集的,準確度遠高於互聯網用戶自己註冊的。
用戶金融數據:如用戶的電話、網路繳費記錄,是否經常欠費等,可用於進行個人信用分析。
由此可以看出,運營商擁有從底層的設備數據到上層用戶的行為數據,而且通常是全網的數據,因此可以說抱著數據的“金礦",是其他廠商所無法媲美的。
大數據挑戰
大數據發展到現在,有了一定的技術和商業積累,但是還有很多難題等待解答,最典型的就是成本、實時性、安全等方面的挑戰。
成本挑戰
運營商普遍受到騰訊、阿裡巴巴等互聯網廠商的OTT應用的擠壓,面臨著管道轉型、利潤下降的風險。而運營商的數據量巨大,以PB為基本單位的數據,處理起來需要巨大的投人。外部商業環境和內部規模的雙重擠壓,對大數據平臺提出了很高的性能和成本要求。
實時性挑戰
如果從廣義的數據質量角度看,隨著時間的推移,數據的價值將逐漸降低,時間越久的數據,價值越低。舉個例子,一家商場需要對當前在商場內的客戶做一個推薦活動。但是端到端採集和處理數據的時間過長,最後推薦平臺得到的用戶列表都是過期的列表,列表上的名單可能已經不在商場內,而新到的用戶還沒有更新到名單中來,所以很多業務對大數據平臺端到端的實時性提出了很高的要求。
安全挑戰
安全挑戰體現在兩個方面:
一方面是在技術上,隨著HTTPS的推廣應用,數據在傳輸過程中採用管理加密的方式,運營商作為管道獲取數據的難度變得越來越大。
另一方面是在法理上,用戶的哪些數據是可以獲取的、哪些是不允許讀取的,始終存在侵犯用戶隱私的法律風險 。