本文轉載自:http://www.cnblogs.com/chay1227/archive/2013/03/17/2964020.html(只作轉載, 不代表本站和博主同意文中觀點或證實文中信息)關係型資料庫 關係型資料庫把所有的數據都通過行和列的二元表現形式表示出來。關係型資料庫的優勢:1. 保....
本文轉載自: http://www.cnblogs.com/chay1227/archive/2013/03/17/2964020.html
(只作轉載, 不代表本站和博主同意文中觀點或證實文中信息)
關係型資料庫
關係型資料庫把所有的數據都通過行和列的二元表現形式表示出來。
關係型資料庫的優勢:
1. 保持數據的一致性(事務處理)
2.由於以標準化為前提,數據更新的開銷很小(相同的欄位基本上都只有一處)
3. 可以進行Join等複雜查詢
其中能夠保持數據的一致性是關係型資料庫的最大優勢。
關係型資料庫的不足:
不擅長的處理
1. 大量數據的寫入處理
2. 為有數據更新的表做索引或表結構(schema)變更
3. 欄位不固定時應用
4. 對簡單查詢需要快速返回結果的處理
--大量數據的寫入處理
讀寫集中在一個資料庫上讓資料庫不堪重負,大部分網站已使用主從複製技術實現讀寫分離,以提高讀寫性能和讀庫的可擴展性。
所以在進行大量數據操作時,會使用資料庫主從模式。數據的寫入由主資料庫負責,數據的讀入由從資料庫負責,可以比較簡單地通過增加從資料庫來實現規模化,但是數據的寫入卻完全沒有簡單的方法來解決規模化問題。
第一,要想將數據的寫入規模化,可以考慮把主資料庫從一臺增加到兩台,作為互相關聯複製的二元主資料庫使用,確實這樣可以把每台主資料庫的負荷減少一半,但是更新處理會發生衝突,可能會造成數據的不一致,為了避免這樣的問題,需要把對每個表的請求分別分配給合適的主資料庫來處理。
第二,可以考慮把資料庫分割開來,分別放在不同的資料庫伺服器上,比如將不同的表放在不同的資料庫伺服器上,資料庫分割可以減少每台資料庫伺服器上的數據量,以便減少硬碟IO的輸入、輸出處理,實現記憶體上的高速處理。但是由於分別存儲字不同伺服器上的表之間無法進行Join處理,資料庫分割的時候就需要預先考慮這些問題,資料庫分割之後,如果一定要進行Join處理,就必須要在程式中進行關聯,這是非常困難的。
--為有數據更新的表做索引或表結構變更
在使用關係型資料庫時,為了加快查詢速度需要創建索引,為了增加必要的欄位就一定要改變表結構,為了進行這些處理,需要對錶進行共用鎖定,這期間數據變更、更新、插入、刪除等都是無法進行的。如果需要進行一些耗時操作,例如為數據量比較大的表創建索引或是變更其表結構,就需要特別註意,長時間內數據可能無法進行更新。
--欄位不固定時的應用
如果欄位不固定,利用關係型資料庫也是比較困難的,有人會說,需要的時候加個欄位就可以了,這樣的方法也不是不可以,但在實際運用中每次都進行反覆的表結構變更是非常痛苦的。你也可以預先設定大量的預備欄位,但這樣的話,時間一長很容易弄不清除欄位和數據的對應狀態,即哪個欄位保存有哪些數據。
--對簡單查詢需要快速返回結果的處理 (這裡的“簡單”指的是沒有複雜的查詢條件)
這一點稱不上是缺點,但不管怎樣,關係型資料庫並不擅長對簡單的查詢快速返回結果,因為關係型資料庫是使用專門的sql語言進行數據讀取的,它需要對sql與越南進行解析,同時還有對錶的鎖定和解鎖等這樣的額外開銷,這裡並不是說關係型資料庫的速度太慢,而只是想告訴大家若希望對簡單查詢進行高速處理,則沒有必要非使用關係型資料庫不可。
/////////////////////////////////////////////////////
NoSQL資料庫
關係型資料庫應用廣泛,能進行事務處理和表連接等複雜查詢。相對地,NoSQL資料庫只應用在特定領域,基本上不進行複雜的處理,但它恰恰彌補了之前所列舉的關係型資料庫的不足之處。
優點:
- 易於數據的分散
- 各個數據之間存在關聯是關係型資料庫得名的主要原因,為了進行join處理,關係型資料庫不得不把數據存儲在同一個伺服器內,這不利於數據的分散,這也是關係型資料庫並不擅長大數據量的寫入處理的原因。相反NoSQL資料庫原本就不支持Join處理,各個數據都是獨立設計的,很容易把數據分散在多個伺服器上,故減少了每個伺服器上的數據量,即使要處理大量數據的寫入,也變得更加容易,數據的讀入操作當然也同樣容易。
典型的NoSQL資料庫
臨時性鍵值存儲(memcached、Redis)、永久性鍵值存儲(ROMA、Redis)、面向文檔的資料庫(MongoDB、CouchDB)、面向列的資料庫(Cassandra、HBase)
一、 鍵值存儲
它的數據是以鍵值的形式存儲的,雖然它的速度非常快,但基本上只能通過鍵的完全一致查詢獲取數據,根據數據的保存方式可以分為臨時性、永久性和兩者兼具 三種。
(1)臨時性
所謂臨時性就是數據有可能丟失,memcached把所有數據都保存在記憶體中,這樣保存和讀取的速度非常快,但是當memcached停止時,數據就不存在了。由於數據保存在記憶體中,所以無法操作超出記憶體容量的數據,舊數據會丟失。總結來說:
。在記憶體中保存數據
。可以進行非常快速的保存和讀取處理
。數據有可能丟失
(2)永久性
所謂永久性就是數據不會丟失,這裡的鍵值存儲是把數據保存在硬碟上,與臨時性比起來,由於必然要發生對硬碟的IO操作,所以性能上還是有差距的,但數據不會丟失是它最大的優勢。總結來說:
。在硬碟上保存數據
。可以進行非常快速的保存和讀取處理(但無法與memcached相比)
。數據不會丟失
(3) 兩者兼備
Redis屬於這種類型。Redis有些特殊,臨時性和永久性兼具。Redis首先把數據保存在記憶體中,在滿足特定條件(預設是 15分鐘一次以上,5分鐘內10個以上,1分鐘內10000個以上的鍵發生變更)的時候將數據寫入到硬碟中,這樣既確保了記憶體中數據的處理速度,又可以通過寫入硬碟來保證數據的永久性,這種類型的資料庫特別適合處理數組類型的數據。總結來說:
。同時在記憶體和硬碟上保存數據
。可以進行非常快速的保存和讀取處理
。保存在硬碟上的數據不會消失(可以恢復)
。適合於處理數組類型的數據
二、面向文檔的資料庫
MongoDB、CouchDB屬於這種類型,它們屬於NoSQL資料庫,但與鍵值存儲相異。
(1)不定義表結構
即使不定義表結構,也可以像定義了表結構一樣使用,還省去了變更表結構的麻煩。
(2)可以使用複雜的查詢條件
跟鍵值存儲不同的是,面向文檔的資料庫可以通過複雜的查詢條件來獲取數據,雖然不具備事務處理和Join這些關係型資料庫所具有的處理能力,但除此以外的其他處理基本上都能實現。
三、 面向列的資料庫
Cassandra、HBae、HyperTable屬於這種類型,由於近年來數據量出現爆發性增長,這種類型的NoSQL資料庫尤其引入註目。
普通的關係型資料庫都是以行為單位來存儲數據的,擅長以行為單位的讀入處理,比如特定條件數據的獲取。因此,關係型資料庫也被成為面向行的資料庫。相反,面向列的資料庫是以列為單位來存儲數據的,擅長以列為單位讀入數據。
面向列的資料庫具有搞擴展性,即使數據增加也不會降低相應的處理速度(特別是寫入速度),所以它主要應用於需要處理大量數據的情況。另外,把它作為批處理程式的存儲器來對大量數據進行更新也是非常有用的。但由於面向列的資料庫跟現行資料庫存儲的思維方式有很大不同,故應用起來十分困難。
總結:關係型資料庫與NoSQL資料庫並非對立而是互補的關係,即通常情況下使用關係型資料庫,在適合使用NoSQL的時候使用NoSQL資料庫,讓NoSQL資料庫對關係型資料庫的不足進行彌補。