原创 Apache-Flink深度解析-DataStream-Connectors之Kafk

  Kafka 簡介 Apache Kafka是一個分佈式發佈-訂閱消息傳遞系統。 它最初由LinkedIn公司開發,LinkedIn於2010年貢獻給了Apache基金會併成爲頂級開源項目。Kafka用於構建實時數據管道和流式應用程序

原创 Flink-Kafka指定offset的五種方式

本文轉自:https://zhuanlan.zhihu.com/p/94592509 默認:從topic中指定的group上次消費的位置開始消費。 所以必須配置group.id參數從消費者組提交的偏移量開始讀取分區(kafka或zooke

原创 flink 加載外部cep規則

主程序代碼: package cepengine.App; import cepengine.domain.Event; import cepengine.domain.InputEventSchema; import cepengi

原创 Fast JDBC access in Python using pyarrow.jvm

While most databases are accessible via ODBC where we have an efficient way via turbodbc to turn results into a pandas.

原创 聯邦學習-隱私保護數據科學解釋 PRIVACY-PRESERVING DATA SCIENCE, EXPLAINED

我們今天要用數據科學解決的許多問題都需要訪問敏感的個人信息-無論是我們的病史,財務記錄還是個人習慣。每天,像您和我這樣的人都會在我們的智能手機,電子設備或醫療設備上生成大量數據。但是由於隱私或專有方面的考慮,用於解決有意義的問題的數據可能

原创 docker鏡像容器目錄遷移

docker鏡像容器目錄遷移 docker運維運維自動化遷移 發佈於 2019-07-23   約 2 分鐘 背景 docker鏡像容器目錄默認存放在Linux系統盤,導致系統盤空間不足,現把它遷移到其他盤 停止服務 systemct

原创 什麼是聯邦學習

在有關私有ML的入門系列文章中,我們將介紹聯邦學習(FL),解釋什麼是FL,何時使用它以及如何使用OpenMined工具實現它。本文中的信息將爲廣泛的讀者所理解,但逐節地,我們將深入研究和理解聯邦學習。 有關該系列的更多信息,請查看介紹性

原创 用JavaScript編寫Apache Spark程序

用JavaScript編寫Apache Spark程序 2020年3月19日 scala spark graal-vm javascript Apache Spark支持使用Scala,Java,Python和R等多種語言進行編程。這種多

原创 MAINTAINING PRIVACY IN MEDICAL DATA WITH DIFFERENTIAL PRIVACY(通過差分隱私維護醫療數據的隱私)

通過差分隱私維護醫療數據的隱私 想象一下,您在一家醫院擔任DL研究人員,而您的工作是尋找幫助醫生抗擊疾病的方法。由於冠狀病毒(無形的敵人)大流行,越來越多的患者和大量CT影像等待被診斷。您決定創建一個圖像分類器,這不僅可以減輕臨牀醫生的負

原创 基於spark實現的全同態數據計算框架sparkfhe實現思路

  Follow the SparkFHE project at https://github.com/SpiRITlab or http://sparkfhe.slack.com Try it out at https://

原创 Gandiva, using LLVM and Arrow to JIT and evaluate Pandas expressions

從11年前開始,我就一直是LLVM的忠實擁護者,那時我開始使用LLVM處理JIT數據結構(例如AVL),然後使用JIT限制的AST樹和TensorFlow圖中的JIT本機代碼。從那時起,LLVM演變爲最重要的編譯器框架生態系統之一,如今已

原创 Weld: 高性能數據分析的公共運行時,spark sql, pandas ,numpy,tensorflow等的Common IR

一直在找一個大數據領域的通用編譯優化器,最近注意到weld,這東西2017年就出來了,看着實在太強大。回頭把相關論文擼一把,很hgih。 官網:https://www.weld.rs/ 論文: https://cs.stanford.ed

原创 公鑰可搜索加密-雙線性對

  我們將大數據存儲在雲服務器上,爲了保護數據隱私,通常會選擇先將數據加密後再上傳。可搜索加密(Searchable Encryption)研究如何在密文上進行關鍵字搜索,分爲對稱可搜索加密(Searchable Symmetric En

原创 Apache Arrow開源項目生態

        參考:https://www.slidestalk.com/AliSpark/ApacheSpark57985   https://arrow.apache.org/blog/2019/10/13/introducing

原创 翻譯-TOWARDS PRIVACY WITH RSTUDIO: ENCRYPTED DEEP LEARNING WITH SYFT AND KERAS

注意:這篇文章首先出現在RStudio AI博客(以前是RStudio TensorFlow博客)上,致力於R的所有深度學習,概率建模和分佈式計算。假定原始讀者熟悉R包tensorflow和keras,旨在允許以慣用的,類似於R的