原创 “與”、“非”、“或”、“異或” 運算

轉載:http://www.cnblogs.com/tankaixiong/p/3777154.html 位運算符主要針對二進制,它包括了:“與”、“非”、“或”、“異或”。從表面上看似乎有點像邏輯運算符,但邏輯運算符是針對兩個關係運算符

原创 幾款開源的ETL工具及ELT初探

幾款開源的ETL工具及ELT初探 轉:http://bigdata.51cto.com/art/201702/530998.htm ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將數據從來源端經過抽取(ex

原创 ETL入門系列 之 ETL工具的功能

https://www.jianshu.com/p/3000165c281a   通過了解一般ETL工具必備的特性和功能,這樣可以判斷出Kettle是否適用你手邊的工作。 連接 任何ETL工具都應用有能力連接到類型廣泛的數據源和數據格式。

原创 ETL常用的三種工具介紹及對比Datastage,Informatica

ETL常用的三種工具介紹及對比Datastage,Informatica  http://www.sohu.com/a/249098751_100194412 ETL是數據倉庫中的非常重要的一環,是承前啓後的必要的一步。ETL負責將分佈的

原创 靈蜂BeeDI ETL

  大數據時代的集成利器 ETL工具 https://blog.csdn.net/little_bee_2004/article/details/80006047 在信息時代大數據環境下,基於分佈式的開源Hadoop架構日漸流行。在爲大數

原创 ETL工具比較

ETL工具比較 轉:http://baijiahao.baidu.com/s?id=1601248654320751991&wfr=spider&for=pc 提取,轉換和加載(ETL)工具使組織能夠在不同的數據系統中訪問,有意義且可用的

原创 Java集合類: Set、List、Map、Queue使用場景梳理

轉載:http://www.cnblogs.com/LittleHann/p/3690187.html?utm_source=tuicool&utm_medium=referral本文主要關注Java編程中涉及到的各種集合類,以及它們的使

原创 pyhon 多節點安裝部署

# !/usr/bin/env python3# -*- coding: utf-8 -*-'import shleximport subprocess__author__ = 'gyz'import ta

原创 語義分析的一些方法

轉載:http://www.flickering.cn/ads/2015/02/%E8%AF%AD%E4%B9%89%E5%88%86%E6%9E%90%E7%9A%84%E4%B8%80%E4%BA%9B%E6%96%B9%E6%B3%

原创 spark 參數說明

轉載:http://blog.javachen.com/2015/06/07/spark-configuration.html以下是整理的Spark中的一些配置參數,官方文檔請參考Spark Configuration。Spark提供三個

原创 淺談大型網絡入侵檢測建設

轉載:https://security.tencent.com/index.php/blog/msg/21一、前言     伊朗2010年被報出核工廠遭受“超級工廠”(Stuxnet)病毒攻擊,蠕蟲通過多個漏洞潛伏在工控系統近兩年未被發現

原创 Spark 內存分配規則

轉載:https://www.cnblogs.com/jcchoiling/p/6494652.htmlhttps://blog.csdn.net/jhk9898/article/details/55101225[Spark性能調優] 第

原创 gRPC

轉載:http://www.cnblogs.com/polinzhuo/p/5323045.htmlhttp://www.cnblogs.com/shanyou/p/grpc.html目錄一、概述二、編譯gRPC三、C#中使用gRPC四、

原创 Flume-NG之KafkaChannel

轉載:http://www.cnblogs.com/lxf20061900/p/4307381.html apache下一個版本(1.6)將會帶來一個新的組件KafKaChannel,顧名思義就是使用kafka做channel,當然在CD

原创 Tesseract-OCR識別中文與訓練字庫實例

轉載:http://www.cnblogs.com/wzben/p/5930538.htmlhttps://my.oschina.net/zhouxiang/blog/161619關於中文的識別,效果比較好而且開源的應該就是Tessera