大數據(big data)是指“無法用現有的軟體工具提取、存儲、搜索、共用、分析和處理的海量的、複雜的數據集合”。業界通常用4個V(即Volume、Variety、Value、Velocity)來概括大數據的特征。下麵我們將對大數據這四種特征做簡要的解釋: Volume : 指代大型數據集,一般在1 ...
大數據(big data)是指“無法用現有的軟體工具提取、存儲、搜索、共用、分析和處理的海量的、複雜的數據集合”。
業界通常用4個V(即Volume、Variety、Value、Velocity)來概括大數據的特征。
下麵我們將對大數據這四種特征做簡要的解釋:
Volume : 指代大型數據集,一般在10TB規模左右,但在實際應用中,很多企業用戶把多個數據集放在一起,已經形成了PB級的數據量。
Variety : 數據來自多種數據源,數據種類和格式日漸豐富,已衝破了以前所限定的結構化數據範疇,囊括了半結構化和非結構化數據。
Value : 以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。
Velocity : 在數據量非常龐大的情況下,也能夠做到數據的實時處理。