數據採集體系
產品及服務:
共享交換系統
共享交換系統是企業級批量數據處理總線產品。可以快速穩定的實現異地、異構數據庫的數交換和整合,確保參建部門之間,參建部門與交換系統之間數據交換過程中的安全,並提供交換審計的管理,對交換流程、交換節點、交換量等進行統一配置和監控等。
治理平臺
社會治理平臺是,用於對政府機構的各種數據源進行標準化採集與管理,並對提供數據源的採集隊伍進行全方位督查與管理的平臺型產品。雲採利用移動系統與GPS相結合,採用大數據分析技術、GIS分析技術、公安部數字身份認證等技術,對政府機構所採集的各類事件、人口、房屋、法人、地址、地理空間等數據進行彙總統計、建立全業務關聯、智能分撥,全方位構建數據採集與隊伍管理系統。
數據填報系統
智能填報功能主要爲系統終端用戶,或者說是使用系統的業務人員,提供一個純HTML頁面、界面友好、簡單易用的填報表設計、發佈、管理與填報數據彙總分析的平臺。用戶不再需要使用專門的報表設計器來設計填報表模板、設計報表樣式與填報屬性、在模板上設置填報數據向數據庫存儲的更新屬性、發佈報表至應用系統平臺、抽取 填報數據進行統計分析等等的一系列複雜且具有開發性質的製表過程。
衆包採集系統
衆包採集系統,將通過發展大衆建立衆包數據採集隊伍,採用移動設備進行衆包採集,將數據進行集中管理,保障數據上傳的及時、高效、更新速度快。同時提供數據的及時更新彙總與輸出,對數據進行過濾、篩選、校驗、整理等,對數據進行質量把控與管理,爲小微企業等衆多數據的需求者(稱爲“金主”)提供數據支持。
深網爬蟲系統
爬蟲系統的功能是下載網頁數據,爲搜索引擎系統提供數據來源。很多大型的網絡搜索引擎系統都被稱爲基於 Web數據採集的搜索引擎系統,比如 Google、Baidu。由此可見網絡爬蟲系統在搜索引擎中的重要性。網頁中除了包含供用戶閱讀的文字信息外,還包含一些超鏈接信息。網絡爬蟲系統正是通過網頁中的超連接信息不斷獲得網絡上的其它網頁。正是因爲這種採集過程像一個爬蟲或者蜘蛛在網絡上漫遊,所以它才被稱爲網絡爬蟲系統或者網絡蜘蛛系統,在英文中稱爲Spider或者Crawler。
數據治理體系
數據資源體系:
-
數據監管保護系統:
數據監管保護系統是對部門、用戶、角色的不同屬性的用戶,在數據庫級、表級、字段級進行訪問控制。對數據採集、數據抽取、數據清洗、數據融合以及數據服務支撐等過程進行監控管理。根據政務數據敏感程度、使用對象、數據用途不同等對數據進行數據脫敏,確保政務數據安全。
-
數據集成管理系統
數據比對系統是根據預定義的數據比對和校驗規則,對數據進行差異分析和異常分析,對於分析的結果,反向推送給數據提供部門,進一步提升數據質量。同時可以配置爲一個自動化的流程,定義比對的時間、比對的業務規則進行數據比對工作。本系統提供數據比對配置,管理和調度功能,通過可視化配置比對任務,並進行任務調度,系統根據比對規則,進行數據比對,並找出數據差異,提供差異數據的導出,同時統計數據匹配情況。
-
數據集成管理系統
數據集成管理系統作爲數據融合與數據治理體系的一個環節,負責將分佈的、異構數據源中的數據如關係數據、平面數據文件等抽取到臨時中間層後進行清洗、轉換、集成,最後加載到數據倉庫或數據集市中,成爲聯機分析處理、數據挖掘的基礎。
-
數據質量工單系統