文章目錄
阿里雲大數據產品體系
1.大數據基礎知識
1.1數據分析
基於某些商業目的,有目的進行數據收集、整理、加工和分析數據,提煉有價值信息
流程如下:
1.2數據倉庫
是一個面向主題的,集成的,非易失的,時變的數據集合,用於支持管理決策
解決的問題
- 爲業務部分提供及時準確的報表
- 爲管理人員提供更強的分析能力
- 爲數據挖掘和知識發現奠定基礎
1.3大數據
無法在可承受的時間範圍內用常規軟件工具進行捕捉
特徵:volume(體量巨大) varietty(種類繁多) value(價值密度低) velocity(處理速度快)
1.4雲計算與大數據
雲計算提供存儲和計算的基礎設施
1.5大數據基本思路
- 減治:簡單化
- 分治:劃分
離線,在線,流式
2.大數據產品體系
2.1概況
2.2公共雲數加平臺
2.3基礎產品
雲數據庫——RDS
- 穩定可靠、可彈性伸縮的在線數據庫服務
- 即開即用,DMS可視化界面
- 兼容MySQL,SQL server,PG等關係型數據庫
- 提供數據庫在線擴容,備份回滾,性能監控及分析等功能
- 只讀實例和臨時實例
優勢:
- 雙機熱備——秒級切換,服務可用性達99.5%
- 安全防護——防DDOS攻擊,SQL注入警告,數據多重備份
- 簡單易用——一鍵式數據遷移,可視化管理操作
分佈式關係型數據庫——DRDS
- 基於RDS的分佈式數據存儲和檢索產品
- 水平拆分可平滑擴展
- 解決用戶單RDS無法支撐業務的苦難
- 降低用戶使用分佈式數據庫的難度
優勢
- 簡單易用——兼容MySQL(交互協議、SQL)
- 穩定可靠——共享阿里組件
- 分佈式——水平拆分,容量達到單節點百倍
- 可擴展——增減節點對應用幾乎無影響,高效數據遷移
表格存儲——TS
- 構建在阿里雲飛天分佈式系統上的NoSQL數據存儲服務
- 海量結構化數據的存儲和實時訪問
- 彈性資源預留
- 實時監控顯示
優勢
- 穩定——自動故障檢測和恢復,系統可用性99.9%
- 安全——用戶級別的數據隔離、訪問控制和權限管理,數據冗餘備份
- 大規模——單表到百TB級數據存儲
- 高性能——毫秒級別單行讀寫延遲,十萬級別QPS
分析型數據庫——ADB
- 海量數據實時高併發在線分析雲計算平臺
- 自由的計算和查詢能力
- 高可用性和高安全性
- 全面兼容MySQL協議
優勢
- 高度的計算自由——通過SQL進行靈活的多維分析、數據透視、數據篩選等
- 急速的響應時間——毫秒級的千億級數據透視,毫秒級的大表關聯計算
- 簡單的使用方式——標準SQL,支持標準MySQL協議,內置多種雲平臺數據的輸入輸出
- 豐富的特點功能——高性能自動索引,海量數據的急速導出等
大數據計算服務——MaxCompute
- 針對TP/BP級數據、實時性要求不高的分佈式處理能力
- 大數據運算能力
- 開箱即用
- 數據安全
優勢
- 分佈式——分佈式集羣架構,可靈活擴展
- 安全性——自動存儲容錯機制,所有計算都在沙箱進行
- 易用性——全面支持基於SQL的數據處理,提供標準API,高併發高吞吐量的數據上傳下載
- 管理與授權——多用戶管理協同分析數據,多種方式對用戶權限管理,靈活的數據訪問控制決策