原创 【開源項目推薦】——純中文本地GPT知識庫搭建項目.assets

大家好,我是獨孤風。 又到了本週的開源項目推薦。近一年多的時間,人工智能迎來了大爆發。GPT相關的大模型的發展讓很多領域都發生了巨大的變化。 但是雖然GPT的自然語言識別功能異常的強大,但回答給我們的知識內容並不盡如人意。那麼,有沒有可以在

原创 下一代APP Store——GPT應用商店GPTs初體驗

uploading-image-126879.png 近期,OpenAI宣佈GPT應用商店正式上線,目前擁有plus的用戶已經可以體驗了。 OpenAI將GPT應用商店命名爲GPTs,這也是之前發佈會就宣傳的內容,終於上線了。簡單的說,GP

原创 數據資產新規!《關於加強數據資產管理的指導意見》發佈(附全文)

​ 1月11日,《關於加強數據資產管理的指導意見》發佈,構建“市場主導、政府引導、多方共建”的數據資產治理模式,逐步建立完善數據資產管理制度,不斷拓展應用場景,不斷提升和豐富數據資產經濟價值和社會價值,推進數據資產全過程管理以及合規化、標

原创 【開源項目】輕量元數據管理解決方案——Marquez

大家好,我是獨孤風。 又到了本週的開源項目推薦。最近推薦的元數據管理項目很多,但是很多元數據管理平臺的功能複雜難用。 那麼有沒有輕量一點的元數據管理項目呢? 今天爲大家推薦的開源項目,就是一個輕量級的元數據管理工具。雖然輕量,但是元數據的

原创 元數據管理平臺對比預研 Atlas VS Datahub VS Openmetadata

大家好,我是獨孤風。元數據管理平臺層出不窮,但目前主流的還是Atlas、Datahub、Openmetadata三家,那麼我們該如何選擇呢? 本文就帶大家對比一下。要了解元數據管理平臺,先要從架構說起。 元數據管理的架構與開源方案 下面介紹

原创 【開源項目推薦】Great Expectations—開源的數據質量工具

大家好,我是獨孤風。 又到了本週的開源項目推薦。數據質量是企業進行數據治理非常重要的一個環節,高質量的數據對管理決策,業務支撐都有非常重要的作用。 只有持續的數據質量改進才能推動數據治理體系的完善,差勁的數據質量就如同頑固的疾病一樣,如果

原创 【Datahub系列教程】Datahub入門必學——DatahubCLI之Docker命令詳解

大家好,我是獨孤風,今天的元數據管理平臺Datahub的系列教程,我們來聊一下Datahub CLI。也就是Datahub的客戶端。 我們在安裝和使用Datahub 的過程中遇到了很多問題。 如何安裝Datahub ? 爲什麼總是拉取鏡像

原创 【開源項目推薦】Apache Superset——最優秀的開源數據可視化與數據探索平臺

大家好,我是獨孤風。 數據可視化是數據領域一個非常重要的應用。而結合了數據可視化和數據探索功能的BI(商業智能)工具,更是被各大公司青睞。但是,由於數據可視化工具的開發成本過高,長期以來一直是商業化的BI工具處於壟斷地位。 那麼,有沒有優

原创 【開源項目推薦】OpenMetadata——基於開放元數據的一體化數據治理平臺

大家好,我是獨孤風。 這幾年數據治理爆火,但遲遲沒有一個優秀的開源數據治理平臺的出現。很多公司選擇元數據管理平臺作爲基礎,再構建數據質量,數據血緣等工具。 今天爲大家推薦的開源項目,是一個一體化的數據治理平臺,一個平臺解決了大部分問題。讓

原创 【開源項目推薦】-支持GPT的智能數據庫客戶端與報表工具——Chat2DB

2023年是人工智能爆火的一年,ChatGPT爲首的一系列的大模型的出現,讓生成式人工智能徹底火了一把。但有人會說,GPT對於我們數據開發來說並沒有什麼作用啊? 今天爲大家推薦的開源項目,就是GPT在數據領域的一個優秀實踐項目。讓我們一起來

原创 最新版本——Hadoop3.3.6單機版完全部署指南

大家好,我是獨孤風,大數據流動的作者。 本文基於最新的 Hadoop 3.3.6 的版本編寫,帶大家通過單機版充分了解 Apache Hadoop 的使用。本文更強調實踐,實踐是大數據學習的重要環節,也能在實踐中對該技術有更深的理解,所以

原创 【開源項目推薦】通用SQL數據血緣分析工具——Sqllineage

大家好,我是獨孤風,從本週開始,爭取每週爲大家帶來一個優秀的開源項目推薦。 開源項目不僅促進了技術的發展和普及,還爲全球範圍內的開發者和用戶社區建立了一個共享知識、協作和創新的平臺。站在巨人的肩膀上才能看的更遠,我們平時也應該多多關注開源

原创 Apache Paimon流式湖倉學習交流羣成立

Apache Paimon是一個流式數據湖平臺。致力於構建一個實時、高效的流式數據湖平臺。這個項目採用了先進的流式計算技術,使企業能夠實時處理和分析大量數據。Apache Paimon 的核心優勢在於它對於大數據生態系統中流式處理的支持,

原创 使用GPT4進行數據分析,竟然被他騙了

上週,OpenAI開發者大會上OpenAI發佈了一系列震撼人心的功能。而最讓我感興趣的,就是GPT4的數據分析功能了。話不多說,趕緊上號體驗一下。 在最新登錄GPT4的時候,都會有下面這個提示,目前已經支持聯網,分析數據,生成圖片的功能了。

原创 最後一天,CDMP數據治理認證高分訓練營(9-10月)開放報名!

大家好,我是獨孤風,一位曾經的港口煤炭工人,目前在某國企任大數據負責人,公衆號大數據流動主理人。 首先告訴大家一個好消息,在大家共同的努力下,我們的CDMP國際數據治理認證訓練營(7-8月)基本收官,全員成績都已經公佈,進入等證書的狀態了,