原创 爲什麼需要一個聰明且強勢的編譯器

英文版鏈接:Why a smart/mighty compiler is required 我從2005年開始學習編程。到現在爲止的這段期間,我已經使用了非常多的語言。包括C, Java, Ruby,JavaScript, Groov

原创 How delta works

Most existing big data storages based on HDFS are lack of feature upsert(if exists then update otherwise add). This mean

原创 數據SCT定律:存儲,計算,時間

其實沒有SCT定律,這個是我根據分佈式CAP定律瞎造的。不過呢,從大數據這個行業來說,我們始終都是在存儲,計算和時間進行權衡,博弈以及突破。某種程度上來說,當擁有其中兩者,可能很難兼顧第三者。 我們日常做的很多事情,其實都是在突破這三者中的

原创 爲 Delta 新增 Upsert(Merge)功能

前言 今天花了一早上以及午休時間,終於把delta的Upsert功能做完了。加上上週週四做的Delta Compaction支持,我想要的功能基本就都有了。 Delta的核心是DeltaLog,其實就是元數據管理。通過該套元數據管理,我們可

原创 多個不同類型對象如何統一JSon序列化小技巧

標題其實沒說明白,就是假設我有四個不同類型的對象:A,B,C,D 但是呢,我序列化的時候不知道這對象會是哪個,反序列化的時候也不知道應該用哪個進行反序列化。 因爲我們知道一般Json 序列化反序列化是這樣的: object JsonUtil

原创 MLSQL 內置Delta數據湖以及Compaction功能

前言 之前寫過一篇文章 Delta的真正用處和價值,你可知道,該項目開源的那天我就集到MLSQL了。不過當時只是嚐鮮性質,主要原因是因爲我一直覺得delta缺了Compaction功能。很多公司其實都有小文件的困擾,而Delta這個問題會更

原创 MLSQL Stack如何讓流調試更加簡單詳解

這篇文章主要給大家介紹了關於MLSQL Stack如何讓流調試更加簡單的相關資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用MLSQL具有一定的參考學習價值,需要的朋友們下面來一起學習學習吧 前言 有一位

原创 MLSQL Stack 讓流調試更加簡單

前言 有一位同學正在調研MLSQL Stack對流的支持。然後說了流調試其實挺困難的。經過實踐,希望實現如下三點: 能隨時查看最新固定條數的Kafka數據 調試結果(sink)能打印在web控制檯 流程序能自動推測json schema(

原创 try.mlsql.tech 上線,快來體驗

前言 好友借了一臺服務器給我用,2核4G, 雖然配置有點低,但是已經超開心了,一直希望能搭建一個能運行一些簡單腳本的服務,這樣用戶就不需要自己搭建了,但一直礙於現在服務器對個人而言還是相當貴,現在終於實現了。 我們也支持一鍵安裝在你的電腦上

原创 MLSQL Stack指南

官網地址: http://www.mlsql.tech 便捷體驗: MLSQL Stack 一鍵體驗 玩一玩: 產品和運營如何利用MLSQL完成excel處理 語法文檔: 語法 常見問題參考:

原创 The next goal of MLSQL Stack

MLSQL is a SQL-Based language and MLSQL Stack is a platform including many systems which provide you the ability to do O

原创 Your Guide to DL with MLSQL Stack (3)

This is the third article of Your Guide with MLSQL Stack series. We hope this article series shows you how MLSQL stack h

原创 Your Guide to Python with MLSQL Stack (二)

In the previous post Your Guide to NLP with MLSQL Stack (一), we already have known how to build a RandomForest model to

原创 Your Guide to NLP with MLSQL Stack (一)

End2End NLP with MLSQL Stack MLSQL stack supports a complete pipeline of train/predict. This means the following steps c

原创 MLSQL NLP Example

-- download from file server. -- run command as DownloadExt.`` where -- from="public/SogouCS.reduced.tar" and -- to="/t