原创 PostgreSQL 模糊匹配表名

1.需求:PG數據庫有很多日期結尾的表需要刪除 2.解決: 1.先用一下SQL查出匹配的表名: SELECT DISTINCT(table_name) from information_schema.columns WH

原创 SQL-查詢語句執行順序

SQL語句執行順序 (8)SELECT (9) DISTINCT (11) (1) FROM (3) JOIN (2) ON (4) WHERE (5) GROUP BY (6) WITH {CUBE | ROLLU

原创 CentOS6 NAT模式 配置靜態IP

CentOS 6.4 使用NAT模式聯網,並配置靜態IP。 實現Xshell連接,並且ping通www.baidu.com 注意:使用 VMWare Workstation pro 15 不要用VMWare player,

原创 指標、維度與度量

何謂指標、維度、度量? 先看這樣一個指標: 上海男性互聯網從業人數 如果是對數據敏感的分析師,立馬就可以看出,數據中有三個維度。 分別是:城市、性別、行業 數據中的度量就是從業人數。 一個數據指標一般由一種或多種維度加上一

原创 PostgreSQL優勢

PostgreSQL是一種非常先進的關係型數據庫管理系統(ORDBMS),幾乎是目前功能最強大、 特性最豐富技術最先進的數據庫系統。 PostgreSQL支持絕大多數主流數據庫特性:

原创 CentOS 7 橋接配置連接網絡

vi /etc/sysconfig/network-scripts/ifcfg-ens33 這個文件: 1.BOOTPROTO 配成Static 2.ONBOOT 配成Yes 3.配置IP、網關、掩碼, IP要和物理主機

原创 OLAP與OLTP

數據庫系統分爲兩種: 1.OLAP 聯機分析處理,是基於數據倉庫的信息分析處理過程,是跨部門、面向主題的。 2.OLTP(Online Transaction Processing) 聯機事務處理,也稱爲生

原创 CentOS6.5詳細安裝(轉發)

https://blog.csdn.net/z1941563559/article/details/80615691

原创 GreenPlum架構

GreenPlum總體架構: Master和Segment節點的功能: 其實每個Master和Segment都是一個單獨的PostgreSQL數據庫,都有自己的一套數據字典 Master與Segment的關係: S

原创 數據分析-維度表與事實表

一個典型的邏輯業務: 如圖有三個維度:市場、產品、日期 那麼三個維度之間的交點,即座標軸中的交點就是一個事實,比如現實生活中的一個購買過程。 事實表:是多個維度表的交點,反過來說事實表中一行存儲了一個事實(業務),

原创 機器學習-邏輯迴歸

邏輯迴歸的原理:就是在一個平面裏,找到一條直線將兩個不同的類分開。 直線函數(直線也稱爲超平面): Wx+b = 0 邏輯迴歸中,將這條直線(超平面)通過樣本訓練出來,即找出這條直線。 如何將樣本事先分好類進行訓練?

原创 MPPDatabase(GreenPlum)和Hadoop

1.MPPDB:(經典的GreenPlum) 1.基於MPP並行處理架構的數據庫 2.Shared-nothing架構,各個節點之間互不干預,但一個節點崩了後就得等待重啓才能訪問該 節點裏的數據(GreenPlu

原创 維度-實際銷售模式

零售事實表每個列都包含POS事務號碼 POS看起來像維度鍵,但清空後會報錯,因爲維度是空的 下面是維度模型和關聯查詢之間的關係

原创 Kimball維度建模(基礎)

1.收集業務需求與數據實現 2.協作維度建模探討: 工作由建模者承擔,但維度模型英語熟悉業務的業務代表探討 3.四步驟維度設計: 1.選擇業務過程 業務過程是一系列操作活動,轉換爲事實表中的事實,例如每個月

原创 Kimball維度建模(維度表技術)

維度表: 1.每個維度表都包含單一的主鍵列,作爲與事實表的外鍵 2.維度表有自己的維度代理鍵,即用來標識唯一性,無意義。+1 3.下鑽 商業分析的基本方法: 上卷(roll-up):上卷是沿