原创 Go語言linux安裝設置

寫於2013年冬,GO1.2 解壓go二進制文件,然後添加至環境變量 vi ~/.bashrc #添加以下內容 export GOROOT=/dp/bin/go export GOARCH=amd64 export GOOS

原创 CentOS6.4 NFS配置

寫於2013年秋 原服務器 sudo vi /etc/exports #設置導出目錄 /logs *(rw,sync,no_root_squash) sudo exportfs -r #使設置生效 重啓服務

原创 SparkETL 用Spark SQL實現ETL

SparkETL SparkETL主要用SQL方式實現數據倉庫ETL,並保持spark的原生多功能、靈活性。採用java對spark功能進行簡單封裝,對於數據源、目標都是關係型數據庫的,從數據抽取、轉換、加載完全採用SQL方式,對

原创 rdbms遷移到Impala2.0

寫於2014年秋,impala2.0 Impala特點 定位於OLAP分析 和hadoop集成,可與hadoop同樣方式擴展 多種數據文件格式存儲 Parquet、text可讀寫;Avro、RCFILE、SequenceFil

原创 pgpool主備模式安裝

寫於2013年秋,pgpool-II-3.3.1 下載pgpool-II-3.3.1.tar.gz文件,上傳至服務器 1、安裝 [hadoop@slave3 bin]$ tar zxvf pgpool-II-3.3.1.tar.

原创 sql server常用

寫於2013年春 1、查列 select a.id table_id, a.name table_name, b.colid column_id, b.name column_name,

原创 golang gRPC示例

gRPC是一個高性能、通用的開源RPC框架,其由Google主要面向移動應用開發並基於HTTP/2協議標準而設計,基於ProtoBuf(Protocol Buffers)序列化協議開發,且支持衆多開發語言。gRPC提供了一種簡單的

原创 hive update delete

Hive 從0.14開始支持事務,即支持update和delete操作。事務操作有嚴格的要求,在寫這篇文章時用的1.1.0有以下限制 BEGIN, COMMIT, and ROLLBACK are not yet support

原创 oracle常用

主要事理於2011、2013年,Oracle11g 1、設置變量 set timing on alter session enable parallel dml; alter session enab

原创 數據倉庫簡介

寫於2014年秋 是什麼 數據倉庫是一個面向主題的、集成的、非易失的、隨時間變化的用來支持管理人員決策的數據集合。 面向主題的(subject-oriented): 數據倉庫圍繞一些主題,如顧客、供應商、產品和

原创 Linux Shell介紹

寫於2014年冬 簡述 Shell是系統的用戶界面,提供了用戶與內核進行交互操作的一種接口。它接收用戶輸入的命令並把它送入內核去執行。 實際上Shell是一個命令解釋器,它解釋由用戶輸入的命令並且把它們送到內核。不僅如此,She

原创 Oracle數據庫開發人員技能

寫於2014年秋 各階段的數據庫開發人員要求是不一樣的。個人認爲:初級階段主要是語法,基本工具使用,中級熟悉某一門數據庫開發、體系結構、基本的操作系統命令,高級對數據庫的底層實現有一定的要求,同時還要熟悉數據庫外的一些如開發語言、

原创 Redis使用介紹

寫於2014年7月,redis2.8 Redis簡介 Redis是什麼? Redis是一個開源的使用ANSI C語言編寫,支持網絡,基於內存亦可持久化,分佈式的key-value數據庫,並提供多種語言的API 。特點是高性能,持

原创 數據倉庫技術及其演變

原因 精細化競爭 精準 用戶精準定位 列表內容 競爭對手、外部情報 速度 客戶需求 產品開發 市場投放 可用 時間延長 不可用時間減少 強度加大 數據增長 來源的多樣化 人工操作 PC、手機生成 機器生成 數據的多

原创 postgresql安裝配置

寫於2013年秋,Postgres9.2 source安裝 1、[hadoop@slave1 bin]$ tar -zxvf postgresql-9.2.4.tar.gz 2、[hadoop@slave1