原创 什麼是數據中臺?什麼是數棲平臺?二者到底有什麼關係?

隨着數據中臺的概念愈發火熱,越來越多的技術公司開始慢慢駛入中臺的賽道,無論是數據中臺、技術中臺還是業務中臺等等,只要與中臺沾上邊兒的,大家理解的概念與期待產品應該有的樣子都各有不同又自成體系。也正因爲此,被“中臺的風”吹着跑的各個企業決策者

原创 ETL調度系統及常見工具對比:Azkaban、Oozie、數棲雲

最近遇到了很多正在研究ETL及其工具的同學向我們抱怨:同樣都在用 Kettle ,起點明明沒差異,但爲什麼別人ETL做的那麼快那麼好,自己卻不斷掉坑? 其實,類似於像 Kettle 這樣開源的工具,已經覆蓋了大部分日常工作所需的功能了,直

原创 數瀾科技發佈2020深耕行動,助力企業數字化建設

數字化浪潮席捲全球,顛覆性創新正在加速,企業面臨着前所未有的挑戰和機遇,必須不斷加速數字化轉型才能生存和領先。數據顯示,處於數字化轉型高級階段的企業獲得快速增長的機率達到低階企業的四倍之多。在數字化轉型過程中,企業需要更爲深入地理解客戶和市

原创 「數據治理那點事」系列之四 | 書同文車同軌:數據治理之數據標準管理

這篇文章主要從數據治理中的重要基礎內容:數據標準入手,從以下幾個角度展開具體講解: 對數據標準的認識誤區 數據標準的定義 企業如何制定數據標準 數據標準化過程中出現難題的原因以及解決方案 一、大數據治理標準體系 根據全國信息

原创 一根飛線的故事-SVG篇

作者|數瀾UED團隊 沒有飛線的地圖就像一個髮際線上移的中年人一樣平淡無奇。 —— By 胖子 每年春運和雙十一的統計圖都因爲有飛線動效才更加吸引眼球,今天要爲大家帶來一根漂亮飛線要用什麼姿勢生成才能。 SVG 本篇是主講SVG來繪製飛

原创 地球如果流浪,大數據究竟能做什麼?

每條大街小巷,每個人的嘴裏,見面第一句話,就是:「道路千萬條,安全第一條,行車不規範,親人兩行淚」。 過了個春節,一眨眼的功夫,當初不太被人看好的《流浪地球》就悄然脫穎而出,蛻變成了「流量地球」? 不得不說,這部電影從劇情、特效到配樂演員

原创 零售數據觀(一):如何花30分鐘成爲一個標籤設計“達人”

作者簡介:鐵叫獸,10年+數據相關經驗,曾在電信、阿里從事過DBA,數倉,解決方案,目前從事零售行業的解決方案。 序言:是否碰到大量的人力投入基於流程管理的信息化系統建設,也運行了好幾年了,同時大數據也熱了好幾年了,但企業IT部門還是無從下

原创 JS源碼分析│簡易mvvm庫的設計實現

作者:刀哥(朱建) 前言:mvvm模式即model-view-viewmodel模式簡稱,單項/雙向數據綁定的實現,讓前端開發者們從繁雜的dom事件中解脫出來,很方便的處理數據和ui之間的聯動。本文將從vue的雙向數據綁定入手,剖析mvvm

原创 風劍分享 | 只有數據最懂公司的痛點,指導企業決策走向

只有數據最懂公司的痛點,指導企業決策走向 在2018中國大數據高峯論壇上,數瀾科技CEO風劍分享了對數據資產化的理解、大數據平臺的建設、大數據落地過程中的挑戰,以及數據應用在未來的機遇與挑戰。具體全文摘錄如下: 一、什麼是數據資產化 “數

原创 Giraph源碼分析(八)—— 統計每個SuperStep中參與計算的頂點數目

作者|白松 目的:科研中,需要分析在每次迭代過程中參與計算的頂點數目,來進一步優化系統。比如,在SSSP的compute()方法最後一行,都會把當前頂點voteToHalt,即變爲InActive狀態。所以每次迭代完成後,所有頂點都是InA

原创 Giraph源碼分析(七)—— 添加消息統計功能

作者|白松 1、 添加類,把每個超步發送的消息量大小寫入Hadoop的Counter中。在org.apache.giraph.counters包下新建GiraphMessages類,來統計消息量。 源代碼如下: package org.ap

原创 史上最強攻略!手把手教你建「數據中臺」!

文章轉自「首席數字官」 ID:ChiefDigitalOfficer 作者:李國歡 4 月 24 日晚,由數瀾科技聯合錦囊專家共同打造的《數據中臺硬核匯》系列線上微課第一講火熱開啓。1000 位 CXO 同時收聽,羣友累計提問 30+,問嗨

原创 驚! 大屏還能長這樣!

數據可視化最吸引人的地方在於,通過科學和藝術的完美結合,讓隱藏在數據中可預測的和出人意料的故事都變得一目瞭然。 一個優秀的數據可視化方案,應該同時具備精確度和精美度。 精確度,即使用基本視覺元素的形狀、尺寸、顏色和位置來呈現數據的多少和

原创 科技賦能零售,最終還是要消失於無形中

導讀: 8月23日,“新零售論壇:零售業的再革命” 由數瀾科技與華院數據在上海百聯創業空間成功舉辦。數瀾科技參謀長武凱(行竹)就“零售數據中臺實踐”進行了分享,並在“新零售創業的機遇與挑戰”圓桌論壇中發表了獨特的見解。 過去的一年裏,零售行

原创 Giraph源碼分析(六)——Edge 分析

1.在Vertex類中,頂點的存儲方式採用鄰接表形式。每個頂點有 VertexId、VertexValue、OutgoingEdges和Halt,boolean型的halt變量用於記錄頂點的狀態,false時表示active,true表示i