原创 雪花模型

當有一個或多個維表沒有直接連接到事實表上,而是通過其他維表連接到事實表上時 雪花模型舉例 ,其圖解就像多個雪花連接在一起,故稱雪花模型。雪花模型是對星型模型的擴展。它對星型模型的維表進一步層次化,原有的各維表可能被擴展爲小的事實

原创 項目考慮

編碼問題,壓縮問題

原创 olap系統思考

1:淘寶取數接口是不是一個事務,如果一面取一面寫會不會有問題。 2:淘寶接口取數 取下來後存儲爲文件還是存儲的sql中。 3:saiku與mondrian是如果聯繫的。 > 假設數據源是infobright,將事實表和維度表load到in

原创 infobright with chartio

Connecting a MySQL Database to Chartio https://chartio.com/docs/datasources/connections/mysql#connection-client-setup

原创 與人爲善

20131127 今天和人爭論了2次,太不應該了. 一次是同事說他比我聰明1千倍,直接惹火我了. 另一次也是這個同事,說我一定搞錯了一件事情,結果是他錯了. 其實不應該生氣的,素質問題 點贊 收藏 分享

原创 各種工具

BIRT: 初識BIRT是一個Eclipse-based開放源代碼報表系統,英文全稱是Business Intelligence and Reporting Tools,商業智能和報表工具。 pentaho:是世界上最流行的開源商務只能

原创 模型指標

1 可信度 2 準確率 3 提升度 4 覆蓋率5 查全率:召回率:Recall,又稱“查全率”; 一般來說,Precision 就是檢索出來的條目中

原创 etl olap

得到ETL的定義:     將數據抽取(Extract)、轉換(Transform)、清洗(Cleansing)、裝載(Load) MDX是一種和SQL類似的語言,它也可以用於查詢、計算和定義一些元數據。只不過SQL是基於OLTP的,而

原创 sql 幾個細節

===== 1: left outer join  sql 中left outer join 時,如果左邊的  ===== 2: 在join中臨時生成小表特別慢 在join中臨時生成小表特別慢 SELECTt.* FROM(SELECT*

原创 saiku mondrian

Designing a star schema : done Loading data from my OLTP database (MySQL) to my star database (MySQL too) : done with

原创 關於什麼是數據分析

今天和老大交流,有種聽君一席話,勝讀10年書的感覺 首先是數據處理的流程: 數據抽取ETL->數據倉庫DW->在線分析處理OLAP->前端展示 數據分析和挖掘最重要的不是技術,而是你能不能正常的定義問題。 用olap的方式理解數據處理

原创 思考問題的角度

1: 今天早上討論測試數據準確性的問題,因爲各種列舉的case很多.大家不知道要怎麼儘量全面的測試. 老大進來後,說了一下:測試的目的是檢測saiku和mongdrian的計算邏輯性,只需要抽象出可能會出現的模式就可以了. 因此列舉出了以

原创 MYSQL登錄錯誤:mysqladmin: connect to server at 'localhost' failed

一、mysql登錄錯誤 mysqladmin: connect to server at 'localhost' failed error: 'Access denied for user 'root'@'localhost' (usin

原创 love to seven year

靈感 :http://chen.yi.bo.blog.163.com/blog/static/150621109201041011419819/ http://cos.name/cn/topic/101643 http://cos.nam

原创 mondrian schema學習過程

===== 維度的排序通過 ordinalColumn       <Level> =====>   <MemberFormatter><Script> return member.getName().substr(member.g