《OdooERP應用與開發案例教程》試讀:第二章-PostgreSQL概述

文/開源智造聯合創始人老楊

本文來自《OdooERP應用與開發案例教程》的試讀章節。書籍尚未出版,請勿轉載。歡迎您反饋閱讀意見。

PostgreSQL是Odoo支持的數據庫。PostgreSQL是起源於大學的一個歷史很長的開源數據庫系統。包括美國航天局NASA、德國證券交易中心、中國的平安、騰訊的微信支付、阿里巴巴的阿里雲都在用PostgreSQL數據庫。

 

PostgreSQL歷史

上世紀70年代Edgar F. Codd博士研究關係型數據庫理論時候,實際開發了一個數據庫產品Ingres。Ingres名字是“Interactive Graphics Retrieval System”的縮寫。後來的Sybase、微軟的SQL Server也是基於這個Ingres數據庫開發的產品。

1985年,加利福尼亞大學伯克利分校的Michael Stonebraker博士等人繼承數據庫Ingres,發佈了Postgres數據庫,這就是PostgreSQL的起源。1989年,Postgres 1.0在研究機構小範圍內發佈。1994年,Postgres發佈了4.2版,隨後,Postgres作爲大學數據庫研究項目終止了。

當時的Postgres數據庫的查詢語言不是SQL,是Postgres獨有的。當時參與人員的感覺是“Postgres的引擎非常好,但沒有方向盤,就像是用操作杆駕駛的汽車一樣非常難操作”,也就是說Postgres的查詢語言太難用了。因此,伯克利分校的研究生們用SQL替換了Postgres的查詢語言,發佈了Postgres95 。

雖然替換成SQL了,Postgres95(相當於Postgres版本5.0)在性能和可靠性方便還有待改善,另外開發人員太少也是個問題。因此,1996年,參考FreeBSD的做法,Postgres開發者分成了Core和Committer兩種角色推進。

1995年,脫離大學研究項目,發佈了Postgres95,而後,Postgres社區發起了命名的討論,是用Postgres95,Postgres96呢,還是別的名字?最後決定,因爲是在Postgres的基礎上增加了SQL,因而用PostgreSQL的名字。版本也改成了5.0,6.0的版本號。

1996年,改名爲PostgreSQL後一個月,1997年1月,發佈了PostgreSQL 6.0。6.5版則增加了MVCC(MultiVersion Concurrency Control),性能大幅提高,同時增加了日文、中文等多字節字符的支持。

2000年前後出現了幾個PostgreSQL服務的企業。最初誕生的是“PostgreSQL Inc”,該公司雖然在1997年設立了社區網站,但商業上卻沒有成功,慢慢地消失了。2000年“Great Bridge Inc”公司誕生了,該公司目標是做“數據庫領域的紅帽子”,同年入選了“25 Coolest Global Companies”,但也沒多久就消失了。2004年誕生了EnterpriseDB公司,該公司一直持續到現在。該公司依託PostgreSQL開發者一起,面向企業提供PostgreSQL技術支持服務。

PostgreSQL的分支很多,基於PostgreSQL的衍生品也很多。SRA OSS的“PowerGres”,“富士通的Enterprise PostgreSQL”廣爲人知。其他的如數據倉庫產品“Netezza”(被IBM收購),並行處理產品“Greenplum”,亞馬遜Web Service之一的數據庫服務“Redshift”,集羣數據庫“StormDB”,流數據庫“TelegraphCQ”及其商業版“Truviso”(被思科收購),國內的阿里雲PostgreSQL數據庫服務等,都是基於PostgreSQL開發的。

PostgreSQL特性

PostgreSQL是一個功能強大的開源數據庫系統。經過長達20年以上的積極開發和不斷改進,PostgreSQL已在可靠性、穩定性、數據一致性等獲得了業內極高的聲譽。目前PostgreSQL可以運行在所有主流操作系統上,包括Linux、Unix(AIX、BSD、HP-UX、SGI IRIX、Mac OS X、Solaris和Tru64)和Windows。PostgreSQL是完全的事務安全性數據庫,完整地支持外鍵、聯合、視圖、觸發器和存儲過程(並支持多種語言開發存儲過程)。它支持了大多數的SQL:2008標準的數據類型,包括整型、數值值、布爾型、字節型、字符型、日期型、時間間隔型和時間型,它也支持存儲二進制的大對像,包括圖片、聲音和視頻。PostgreSQL對很多高級開發語言有原生的編程接口,如C/C++、Java、.Net、Perl、Python、Ruby、Tcl 和ODBC以及其他語言等,也包含各種文檔。

作爲一種企業級數據庫,PostgreSQL以它所具有的各種高級功能而自豪,像多版本併發控制(MVCC)、按時間點恢復(PITR)、表空間、異步複製、嵌套事務、在線熱備、複雜查詢的規劃和優化以及爲容錯而進行的預寫日誌等。它支持國際字符集、多字節編碼並支持使用當地語言進行排序、大小寫處理和格式化等操作。它也在所能管理的大數據量和所允許的大用戶量併發訪問時間具有完全的高伸縮性。目前已有很多PostgreSQL的系統在實際生產環境下管理着超過4TB的數據。一些PostgreSQL系統的極限值如下表所列:

極限值:

最大單個數據庫大小 不限

最大數據單表大小 32 TB

單條記錄最大 1.6 TB

單字段最大允許 1 GB

單表允許最大記錄數 不限

單表最大字段數 250 - 1600 (取決於字段類型)

單表最大索引數 不限

由於PostgreSQL的優異性能,它已贏得最終用戶和業內的多次大獎,包括Linux新媒體(Linux New Media)的最佳數據庫獎和5次Linux期刊編輯選出的最佳數據庫獎。

PostgreSQL用戶

PostgreSQL的知名用戶包括Skype、NTT、Salesforce的Heroku雲數據庫平臺、Etsy等大型企業。PostgreSQL在日本數據庫市場有超過60%的市場佔有率,大量的製造業、遊戲行業、企業ERP系統都採用了PostgreSQL。

2010年以來,隨着中國互聯網的迅速崛起, PostgreSQL在國內迅速發展,受到越來越多的企業尤其是互聯網企業重視。據公開報導,騰訊、阿里、中國平安、蘇寧、去哪兒網、斯凱網絡等企業都在大規模應用PostgreSQL。尤其是騰訊,基於PostgreSQL架構了TDW(Tencent Distributed Warehouse騰訊分佈式數據倉庫)平臺,存儲騰訊海量核心業務數據。

TDW(Tencent Distributed Warehouse):騰訊分佈式數據倉庫,是騰訊公司海量數據處理平臺的核心部件,承載着騰訊公司各業務羣產品數據(如互聯網增值、SNS、網遊、電商等)的儲存和處理工作。目前,TDW支持百PB級數據的離線存儲和計算,爲業務提供海量、高效、穩定的大數據平臺支持和決策支持。

 

據2017年PostgreSQL技術大會騰訊大數據工程師的發言,騰訊TDW數據倉庫集羣超過100臺服務器,超過100T(1T = 1000G)的數據量。

蘇寧Citus系統案例。蘇寧Citus是一個大數據分析系統,業務場景大致是,每5分鐘從多個業務系統抽取業務數據到Citus數據庫,每次要更新Citus中10張明細表,大約更新30萬條數據記錄。Citus中保留最近若干天的數據,數據總量大約3000萬條記錄。Citus數據庫每5分鐘分析抽取一次數據,形成30多張不同用途的業務報表。

Citus原來是基於IBM的DB2數據庫構建的,如下圖所示,DB2已經不堪重負,尤其是大促時候。而且,預計一年後數據量將增長到10倍,也就是每5分鐘要更新300萬條數據,Citus數據量將達到3億條數據記錄。

 

蘇寧Citus技術團隊調查研究之後,決定用PostgreSQL替換IBM DB2數據庫。替換後的壓力測試表明,系統實際性能表現超過設計目標50%以上。上線運行半年以來,效果相當穩定。蘇寧的案例表明,PostgreSQL性能表現遠優於IBM的DB2!

 

文章編輯:開源智造(OSCG) - 源自歐洲,業界領先的免費開源ERP Odoo金牌服務機構

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章