VMware Greenplum 7 正式發佈!

在當今瞬息萬變的商業環境中,企業持續尋求創新途徑以優化運營、簡化決策過程,並構建獨特的競爭優勢。實現這些目標的關鍵在於有效利用海量數據資源。然而,這項任務並不輕鬆。數據的數量、複雜性和來源呈現出爆發性增長,同時從數據中提煉價值的技術也日新月異。 

VMware Greenplum 在這個領域發揮着至關重要的作用。Greenplum 是一個統一分析和人工智能 (AI) 平臺,旨在幫助企業充分利用其數據資源。無論是結構化數據、半結構化數據還是非結構化數據,Greenplum 都能提供一個統一的平臺,作爲無可爭議的 "單一真相源",而且通過對向量數據的並行處理支持,Greenplum可以與最新的大語言模型方法(LLM)集成。 

集成的力量

VMware Greenplum 核心是以開源 PostgreSQL 項目爲基礎,其獨特之處在於將商業智能(BI)和人工智能(AI)功能無縫集成在同一平臺上。這種將各種工具和技術集成在一起的方式,使得企業能夠高效快速地應對複雜的挑戰。同時,所有的操作都可以通過用戶熟悉的 SQL 數據庫界面來實現。 

試想一下,企業需要進行大量基於客戶反饋文檔的智能搜索,並將這些信息與詳細的客戶在線交易處理(OLTP)交易歷史記錄合併。在過去,這些任務需要涉及各種數據孤島和不同的工具,而現在,這些都可以在 Greenplum 平臺內無縫執行。這樣就極大地提高了企業的運營效率,並增強了對客戶需求的響應能力。 

從商業智能到人工智能的無縫銜接

 

Greenplum 的一個顯著特點是能夠統一數據分析和人工智能需求,促進從商業智能到人工智能應用的平穩過渡。這種過渡可以在任何規模上進行,無論處理小型數據集還是PB級的龐大數據生態系統。 

Greenplum 多功能性得益於其適應不斷變化的數據格局的卓越能力。隨着數據量和數據種類的不斷增加以及新分析技術的不斷湧現,VMware Greenplum 也在同步發展。這有助於使企業始終站在數據驅動決策的最前沿,不斷髮掘新的洞察力和機遇。 

VMware Greenplum 7

 

VMware Greenplum 7 彰顯了我們對創建和演進一個內在安全、成熟和靈活的基於SQL的在線分析處理(OLAP)平臺的承諾。這一創新平臺引入了一系列增強和新加功能,重點是針對各種數據類型(無論是結構化、半結構化還是非結構化數據)的資源管理和複雜分析功能。 

VMware Greenplum 7 在無縫數據可擴展性、多負載處理和部署靈活性方面也有許多重要更新。 

VMware Greenplum 7 的新功能

以下是 VMware Greenplum 7 中引入的強大新功能: 

開放源代碼和 PostgreSQL 12 的衍生:VMware Greenplum 7 建立在開源代碼的基礎上,利用了現代 PostgreSQL 版本的功能、可靠性和靈活性。與前一版本相比,Greenplum 7 植根於 PostgreSQL 12,並整合了近5年以來 PostgreSQL 的發佈版本。

多種索引類型: VMware Greenplum 7 支持多種索引類型,包括 B 樹索引、哈希索引、位圖索引、塊範圍索引、文本索引、地理空間索引和 AI 向量索引。該功能可優化數據檢索和查詢性能。Greenplum 查詢優化器自 2009 年以來不斷改進,在第 6 版中取得了良好的性能記錄,在第 7 版中得到了擴展,提供了全面的索引選擇支持。 

利用 PXF 增強數據聯合:VMware Greenplum 7 中的平臺擴展框架 (PXF) 經過改進,實現了卓越的數據聯合。企業現在可以通過 JDBC 查詢亞馬遜簡單存儲服務 (S3) 對象存儲、Hadoop 分佈式文件系統 (HDFS) 和其他關係數據庫中的數據集。它利用 PostgreSQL 的外來數據封裝器 API 來並行訪問遠程數據源,提供抽象數據模型來管理遠程數據的安全性和統計數據,以優化查詢。

增強文本搜索:VMware Greenplum 7 擴展了文本搜索功能,同時支持詞法搜索和人工智能驅動的語義搜索,以提供更準確的搜索結果。詞法搜索支持基於關鍵字的傳統文本搜索,對於語義搜索,則由人工智能和向量 embeddings 提供支持。 

升級地理空間分析:VMware Greenplum 7 通過集成 PostGIS 版本 3 升級了地理空間分析功能。這一改進大大提高了地理空間查詢的速度和特徵豐富度。 

行級安全權限: 該功能是對 VMware Greenplum 中已有的基於角色的安全模型以及表級和列級權限的補充。

用於增強數據建模的生成列: VMware Greenplum 7 中引入了生成列,從而改進了數據抽象和建模,解決了安全特徵保留數據屏蔽等用例問題。 

改進的 DBA 查詢功能: Greenplum 7 對 DBA 查詢功能進行了大量改進,包括 UPSERT 支持、帶有事務的用戶定義函數,以及對ALTER TABLE的改進以減少數據重寫。 

增強的半結構化和非結構化數據分析: Greenplum 7 除支持 XML 文檔外,還支持半結構化數據處理,如增強的 JSON 和數組數據處理功能。全文搜索和基於文本的詞法搜索索引可實現高效的文本存儲、索引和搜索。此外,向量嵌入可實現非結構化數據的濃縮和高效表示,允許跨多種語言對匹配的文檔、圖像和視頻進行相似性搜索,包括多語言搜索。 

PostgreSQL 擴展生態系統: 更全面的PostgreSQL 擴展支持,如高級密碼檢查、模糊字符串匹配、Hyperloglog、用於網絡數據的 Ip4r、用於媒體數據的 Isn、納秒時間戳、稀疏向量、用於透視的 Tablefunc、用於唯一標識符的 UUID 以及用於人工智能向量嵌入的 pg_vector,已全部支持。

先進的資源管理: Greenplum 7 引入了一系列高級資源管理功能。這些功能可確保在高負載情況下的穩健性能。 

VMware vSphere 部署模型: Greenplum 7 可以參考推薦的架構部署在裸機或公共雲環境中。也可利用Greenplum 7版本中提供的自動部署模式無縫集成到vSphere私有云環境中。 

多數據中心災難恢復解決方案: 作爲多數據中心災難恢復解決方案的一部分,數據通過事務日誌歸檔進行復制,從而實現比 Greenplum 以前版本更高效、更低的恢復點目標(RPO)和恢復時間目標(RTO)災難恢復解決方案。

新的擴展 PostgresML:提供新的用戶定義函數,使用戶可以在 VMware Greenplum 中使用數以萬計的開源人工智能/機器學習預訓練模型。 

VMware Greenplum 的優勢

VMware Greenplum 爲企業帶來的衆多優勢可分爲四個關鍵領域:靈活性速度和規模生產效率以及彈性 

靈活性

基礎架構的多功能性:VMware Greenplum 在部署方面具有顯著的靈活性,可兼容各種基礎架構類型。它針對裸機、公有云和基於 vSphere 的私有云環境進行了優化。這意味着企業可以選擇最適合其需求的基礎架構,而無需犧牲性能或效率。 

專用優化:Greenplum 提供專用的參考架構,確保無縫集成到不同的基礎架構設置中,降低部署複雜性。

速度和規模  

數據庫內分析: Greenplum 的數據庫內分析功能大大加快了透視時間。這一功能意味着數據分析師和科學家可以直接在數據庫中原地進行復雜的分析,而無需進行耗時的數據傳輸。 

PB 級數據處理: Greenplum 可處理海量數據,甚至是 PB 級數據。這確保了企業能夠高效地分析和管理龐大的數據集,從其最大的數據存儲庫中獲取洞察力。 

生產效率

數據多樣性: Greenplum 擅長在單一平臺上管理各種類型的數據。它能無縫處理結構化、半結構化和非結構化數據,包括文本、圖像、視頻、向量、地理空間信息、圖形和語音數據。這種多功能性使企業能夠整合數據源,無論數據存儲在哪裏,都能更輕鬆地對其進行分析。 

數據可訪問性: Greenplum 能夠處理和分析來自不同來源的各種格式的數據,從而減少了預處理和整合來自多個來源的數據所需的時間和精力,提高了工作效率。 

彈性

成熟的基礎: Greenplum 建立在開源數據庫 PostgreSQL 的基礎之上,這是一個久經考驗的成熟數據庫平臺。這提高了關鍵任務應用程序和數據工作負載的可靠性和穩定性。 

增強安全性: Greenplum 集成了增強的安全功能,可幫助企業保護數據安全。這包括身份驗證機制、加密選項和訪問控制。 

企業支持: Greenplum 提供強大的企業級支持,使企業能夠獲得管理和優化數據平臺所需的協助。 

災難恢復: 通過遠程災難恢復等功能,Greenplum 提供了數據備份和恢復機制,最大限度地減少了災難發生時的停機時間和數據丟失。 

隨着新版本的推出,VMware Greenplum 不僅僅是一個平臺,更是轉型的催化劑。它使企業能夠充分發揮數據資產的潛力,提高運營效率,加快決策進程,並最終實現卓越的客戶響應能力。隨着數據不斷塑造企業的未來,Greenplum 成爲創新的引領者,引導企業從 BI 走向 AI,甚至更遠。與Greenplum一起擁抱統一數據分析和人工智能的力量吧,將您的企業推向數據成爲終極競爭優勢的未來!

立即開始使用 VMware Greenplum 7:
https://network.pivotal.io/products/vmware-greenplum 

閱讀了解在三星第 5 代 NVMe 硬盤上如何使用 Greenplum 7 建立新的參考架構,從而對大數據、分析和數據倉庫的未來產生深遠影響:https://tanzu.vmware.com/content/blog/vmware-greenplum-on-samsung-performance

 

內容來源|公衆號:VMware 中國研發中心

有任何疑問,歡迎掃描下方公衆號聯繫我們哦~

​​​​​​​

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章