本人微信公眾號,歡迎掃碼關註! 大數據概論 1、大數據概念 大數據(big data),指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。 最小的基本單位是bit,按順序給出所有單位: ...
本人微信公眾號,歡迎掃碼關註!
大數據概論
1、大數據概念
大數據(big data),指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
最小的基本單位是bit,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
1Byte = 8bit 1K = 1024bit 1MB = 1024K 1G = 1024M
1T = 1024G 1P = 1024T 1E = 1024P 1Z = 1024E
1Y = 1024Z 1B = 1024Y 1N = 1024B 1D = 1024N
2、大數據的特點
1)Volume(大量)
截至目前,人類生產的所有印刷材料的數據量是200PB,而歷史上全人類總共說過的話的數據量大約是5EB。當前,典型個人電腦硬碟的容量為TB量級,而一些大企業的數據量已經接近EB量級。
2)Velocity(高速)
這是大數據區分於傳統數據挖掘的最顯著特征。根據IDC的“數字宇宙”的報告,預計到2020年,全球數據使用量將達到35.2ZB。在如此海量的數據面前,處理數據的效率就是企業的生命。
天貓雙十一:2016年6分58秒,天貓交易額超過100億
3)Variety(多樣)
這種類型的多樣性也讓數據被分為結構化數據和非結構化數據。相對於以往便於存儲的以資料庫/文本為主的結構化數據,非結構化數據越來越多,包括網路日誌、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。
4)Value(低價值密度)
價值密度的高低與數據總量的大小成反比。比如,在一天監控視頻中,我們只關心老師晚上在床上健身那一分鐘,如何快速對有價值數據“提純”成為目前大數據背景下待解決的難題。
3、大數據的應用場景
1)O2O:百度大數據+平臺通過先進的線上線下打通技術和客流分析能力,助力商家精細化運營,提升銷量。
2)零售:探索用戶價值,提供個性化服務解決方案;貫穿網路與實體零售,攜手創造極致體驗。經典案例,子尿布+啤酒。
3)旅游:深度結合百度獨有大數據能力與旅游行業需求,共建旅游產業智慧管理、智慧服務和智慧營銷的未來。
4)商品廣告推薦:給用戶推薦訪問過的商品廣告類型
5) 房產:大數據全面助力房地產行業,打造精準投策與營銷,選出更合適的地,建造更合適的樓,賣給更合適的人。
6)保險:海量數據挖掘及風險預測,助力保險行業精準營銷,提升精細化定價能力。
7)金融:多維度體現用戶特征,幫助金融機構推薦優質客戶,防範欺詐風險。
8)移動聯通:移動聯通:根據用戶年齡、職業、消費情況,分析統計哪種套餐適合哪類人群。對市場人群精准定制。
9)人工智慧
4、大數據的發展前景
1)黨的十八屆五中全會提出“實施國家大數據戰略”,國務院印發《促進大數據發展行動綱要》,大數據技術和應用處於創新突破期,國內市場需求處於爆發期,我國大數據產業面臨重要的發展機遇。
2)國際數據公司IDC預測,到2020年,企業基於大數據計算分析平臺的支出將突破5000億美元。目前,我國大數據人才只有46萬,未來3到5年人才缺口達150萬之多。
- 人才缺口計算
150w-40w=110w
110W/5年 = 22w/年
22w/12月=1.83w/月
自古不變的真理:先入行者吃肉,後入行者喝湯,最後到的買單!
3)2017年北京大學、中國人民大學、北京郵電大學等25所高校成功申請開設大數據課程。
4)大數據屬於高新技術,大牛少,升職競爭小;
5)在北京大數據開發工程師的平均薪水已經到17800元(數據統計來職友集),而且目前還保持強勁的發展勢頭。