文/開源智造聯合創始人老楊 本文來自《OdooERP應用與開發案例教程》的試讀章節。書籍尚未出版,請勿轉載。歡迎您反饋閱讀意見。 PostgreSQL是Odoo支持的資料庫。PostgreSQL是起源於大學的一個歷史很長的開源資料庫系統。包括美國航天局NASA、德國證券交易中心、中國的平安、騰訊的微 ...
文/開源智造聯合創始人老楊
本文來自《OdooERP應用與開發案例教程》的試讀章節。書籍尚未出版,請勿轉載。歡迎您反饋閱讀意見。
PostgreSQL是Odoo支持的資料庫。PostgreSQL是起源於大學的一個歷史很長的開源資料庫系統。包括美國航天局NASA、德國證券交易中心、中國的平安、騰訊的微信支付、阿裡巴巴的阿裡雲都在用PostgreSQL資料庫。
PostgreSQL歷史
上世紀70年代Edgar F. Codd博士研究關係型資料庫理論時候,實際開發了一個資料庫產品Ingres。Ingres名字是“Interactive Graphics Retrieval System”的縮寫。後來的Sybase、微軟的SQL Server也是基於這個Ingres資料庫開發的產品。
1985年,加利福尼亞大學伯克利分校的Michael Stonebraker博士等人繼承資料庫Ingres,發佈了Postgres資料庫,這就是PostgreSQL的起源。1989年,Postgres 1.0在研究機構小範圍內發佈。1994年,Postgres發佈了4.2版,隨後,Postgres作為大學資料庫研究項目終止了。
當時的Postgres資料庫的查詢語言不是SQL,是Postgres獨有的。當時參與人員的感覺是“Postgres的引擎非常好,但沒有方向盤,就像是用操作桿駕駛的汽車一樣非常難操作”,也就是說Postgres的查詢語言太難用了。因此,伯克利分校的研究生們用SQL替換了Postgres的查詢語言,發佈了Postgres95 。
雖然替換成SQL了,Postgres95(相當於Postgres版本5.0)在性能和可靠性方便還有待改善,另外開發人員太少也是個問題。因此,1996年,參考FreeBSD的做法,Postgres開發者分成了Core和Committer兩種角色推進。
1995年,脫離大學研究項目,發佈了Postgres95,而後,Postgres社區發起了命名的討論,是用Postgres95,Postgres96呢,還是別的名字?最後決定,因為是在Postgres的基礎上增加了SQL,因而用PostgreSQL的名字。版本也改成了5.0,6.0的版本號。
1996年,改名為PostgreSQL後一個月,1997年1月,發佈了PostgreSQL 6.0。6.5版則增加了MVCC(MultiVersion Concurrency Control),性能大幅提高,同時增加了日文、中文等多位元組字元的支持。
2000年前後出現了幾個PostgreSQL服務的企業。最初誕生的是“PostgreSQL Inc”,該公司雖然在1997年設立了社區網站,但商業上卻沒有成功,慢慢地消失了。2000年“Great Bridge Inc”公司誕生了,該公司目標是做“資料庫領域的紅帽子”,同年入選了“25 Coolest Global Companies”,但也沒多久就消失了。2004年誕生了EnterpriseDB公司,該公司一直持續到現在。該公司依托PostgreSQL開發者一起,面向企業提供PostgreSQL技術支持服務。
PostgreSQL的分支很多,基於PostgreSQL的衍生品也很多。SRA OSS的“PowerGres”,“富士通的Enterprise PostgreSQL”廣為人知。其他的如數據倉庫產品“Netezza”(被IBM收購),並行處理產品“Greenplum”,亞馬遜Web Service之一的資料庫服務“Redshift”,集群資料庫“StormDB”,流資料庫“TelegraphCQ”及其商業版“Truviso”(被思科收購),國內的阿裡雲PostgreSQL資料庫服務等,都是基於PostgreSQL開發的。
PostgreSQL特性
PostgreSQL是一個功能強大的開源資料庫系統。經過長達20年以上的積極開發和不斷改進,PostgreSQL已在可靠性、穩定性、數據一致性等獲得了業內極高的聲譽。目前PostgreSQL可以運行在所有主流操作系統上,包括Linux、Unix(AIX、BSD、HP-UX、SGI IRIX、Mac OS X、Solaris和Tru64)和Windows。PostgreSQL是完全的事務安全性資料庫,完整地支持外鍵、聯合、視圖、觸發器和存儲過程(並支持多種語言開發存儲過程)。它支持了大多數的SQL:2008標準的數據類型,包括整型、數值值、布爾型、位元組型、字元型、日期型、時間間隔型和時間型,它也支持存儲二進位的大對像,包括圖片、聲音和視頻。PostgreSQL對很多高級開發語言有原生的編程介面,如C/C++、Java、.Net、Perl、Python、Ruby、Tcl 和ODBC以及其他語言等,也包含各種文檔。
作為一種企業級資料庫,PostgreSQL以它所具有的各種高級功能而自豪,像多版本併發控制(MVCC)、按時間點恢復(PITR)、表空間、非同步複製、嵌套事務、線上熱備、複雜查詢的規劃和優化以及為容錯而進行的預寫日誌等。它支持國際字元集、多位元組編碼並支持使用當地語言進行排序、大小寫處理和格式化等操作。它也在所能管理的大數據量和所允許的大用戶量併發訪問時間具有完全的高伸縮性。目前已有很多PostgreSQL的系統在實際生產環境下管理著超過4TB的數據。一些PostgreSQL系統的極限值如下表所列:
極限值:
最大單個資料庫大小 不限
最大數據單表大小 32 TB
單條記錄最大 1.6 TB
單欄位最大允許 1 GB
單表允許最大記錄數 不限
單表最大欄位數 250 - 1600 (取決於欄位類型)
單表最大索引數 不限
由於PostgreSQL的優異性能,它已贏得最終用戶和業內的多次大獎,包括Linux新媒體(Linux New Media)的最佳資料庫獎和5次Linux期刊編輯選出的最佳資料庫獎。
PostgreSQL用戶
PostgreSQL的知名用戶包括Skype、NTT、Salesforce的Heroku雲資料庫平臺、Etsy等大型企業。PostgreSQL在日本資料庫市場有超過60%的市場占有率,大量的製造業、游戲行業、企業ERP系統都採用了PostgreSQL。
2010年以來,隨著中國互聯網的迅速崛起, PostgreSQL在國內迅速發展,受到越來越多的企業尤其是互聯網企業重視。據公開報導,騰訊、阿裡、中國平安、蘇寧、去哪兒網、斯凱網路等企業都在大規模應用PostgreSQL。尤其是騰訊,基於PostgreSQL架構了TDW(Tencent Distributed Warehouse騰訊分散式數據倉庫)平臺,存儲騰訊海量核心業務數據。
TDW(Tencent Distributed Warehouse):騰訊分散式數據倉庫,是騰訊公司海量數據處理平臺的核心部件,承載著騰訊公司各業務群產品數據(如互聯網增值、SNS、網游、電商等)的儲存和處理工作。目前,TDW支持百PB級數據的離線存儲和計算,為業務提供海量、高效、穩定的大數據平臺支持和決策支持。
據2017年PostgreSQL技術大會騰訊大數據工程師的發言,騰訊TDW數據倉庫集群超過100台伺服器,超過100T(1T = 1000G)的數據量。
蘇寧Citus系統案例。蘇寧Citus是一個大數據分析系統,業務場景大致是,每5分鐘從多個業務系統抽取業務數據到Citus資料庫,每次要更新Citus中10張明細表,大約更新30萬條數據記錄。Citus中保留最近若幹天的數據,數據總量大約3000萬條記錄。Citus資料庫每5分鐘分析抽取一次數據,形成30多張不同用途的業務報表。
Citus原來是基於IBM的DB2資料庫構建的,如下圖所示,DB2已經不堪重負,尤其是大促時候。而且,預計一年後數據量將增長到10倍,也就是每5分鐘要更新300萬條數據,Citus數據量將達到3億條數據記錄。
蘇寧Citus技術團隊調查研究之後,決定用PostgreSQL替換IBM DB2資料庫。替換後的壓力測試表明,系統實際性能表現超過設計目標50%以上。上線運行半年以來,效果相當穩定。蘇寧的案例表明,PostgreSQL性能表現遠優於IBM的DB2!
文章編輯:開源智造(OSCG) - 源自歐洲,業界領先的免費開源ERP Odoo金牌服務機構