數據倉庫技術 指的是 提供信息以支持商務決策的整個過程;
商業智能,指的是對數據倉庫中存儲的數據進行記錄和分析的一個過程;
數據倉庫/商業智能(DW/BI),作爲整個端到端系統的名稱;
ETL指的是抽取extract、轉換transform、加載load的一個過程;
業務過程維度建模,即數據集市
項目經理指定溝通計劃解決項目支持者的需求,經常性地溝通能夠管理期望;
面對面溝通比提供項目文檔效果更佳;
暴露問題,向上級彙報;
與業務用戶溝通:應關注性能、未考慮到的事項和時間期限;提醒業務用戶DW/BI系統開發的特點迭代性;避免使用技術性詞彙,可以選用多種溝通方式中的一種;
與主管團隊的溝通:
確保高可見度,業務結構對DW/BI系統的期望可見;
召開項目啓動會議:整個團隊對項目的當前狀況和未來預期達成期望;
項目期間記錄問題;
DW/BI項目中兩類問題,一類是影響這個項目開展的問題,一類是完成某個任務時所必須解決的問題;
問題需要記錄以及在會議上進行審查;
數據管理員,管理數據規範;
質量保證分析員在數據加載的過程中工作量比較大,需要確保ETL系統的正常運行,進行數據驗證;
組建團隊,提升團隊凝聚力;
自由代理人,作爲DW/BI的顧問;
基於企業需求的優先級排序;
認可企業數據持續集成的好處,並執行;
IT結構和業務機構需要緊密配合;
建立企業級的架構,避免數據“煙囪”,讓各個部門數據之間能夠共享,讓數據融合產生價值;
數據管理員應該爲企業內部所有交叉機構的信息確定通用的的定義和業務轉換的規則;
因爲源數據中存在一些不可預料的數據真實性問題,ETL系統設計與開發時間難以預估和按時提交;
需要有個核心團隊擔任DW/BI系統設計和開發的重要職責;
業務分析員負責業務需求定義活動,並且將這些需求描述爲技術架構、維度模型和BI應用程序,需要以用戶爲中心來考慮問題;
數據管理員負責推動整個機構;
提倡小規模項目快速上市;
DW/BI的設計必須體現業務價值;
如果項目時間表持續時間很久,可以採用快速開發應用程序的方法,如敏捷開發、極限編程等;
項目範圍的確定應該由業務需求來驅動;
可行性分析:專指技術可行性, 這裏指DW/BI過程中與數據本身相關的可行性;
數據探查是一種數據分析技術,主要描述數據的內容、一致性和結構,select distinct 可以被看做是一種數據探查;
概念驗證 論證項目對業務機構產生的影響;
每引入一個新的主要數據源,開發週期就可能需要延長六個月;
確定項目範圍;
維度建模,需要關注用戶使用的便利性和BI查詢的性能;
維度模型的兩個基本組成,是事實表和維度表;
BI應用程序,可以是簡單的報表應用,也可以是與運營事務處理系統交互的分析性應用程序;
需要有業務發起人;
強制性業務動機、戰略性業務動機;
可行性分析:專指技術可行性;
項目和項目羣的概念、分三條線分工指定計劃並執行包含1技術架構設計2ETL方案設計3BI項目設計;;
在DW/BI項目過程中容易陷入的陷阱和誤區有以下一些,可以給予關注: