千萬級別數據實時複雜統計效率優化

原創

2020-07-03 20:27

有個業務需求：千萬級別數據，要根據位置、白天出現時間、晚上不出現時間，出現次數大於某個範圍的複雜組合統計。

mysql在千萬級別的數據時，查詢效率就有明細的下降。而時間數據從上千萬級上升到上億級，查詢效率很慢，等待很久。

除了加索引等常規優化，想到用 shardingsphere 來分庫分表，調研之後，發現
shardingsphere 不支持having等統計查詢，對子查詢支持也不是非常友好。ShardingSphere不支持的SQL操作（having等複雜統計及子查詢）

後來發現這些數據，大部分數據其實是很難用到到，因爲業務要統計大於多少次的，並按次數倒序，於是把那些出現次數少的進行刪除，數據一下降到百萬級別的，查詢效率明細提升。

優化不光是考慮技術上的，一些技術難做到的，還要結合業務進行優化。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

redis 服務器搭建（windows）

一、redi下載地址：https://github.com/MicrosoftArchive/redis/releases 二、下載版本：三、安裝： 1.解壓縮 2.點擊 3.啓動： 4.redi服務器就搭建成功了

SatAndSun

2020-07-06 15:29:55

Walkthrough: Creating Your First Application-Level Add-in for Excel

Source： http://msdn.microsoft.com/zh-cn/library/cc668205.aspx?cs-save-lang=1&cs-lang=csharp#code-snippet-1 This intr

波特王子

2020-07-06 10:45:57

PHP:ODBC處理EXCEL電子表格數據庫實例

來源：http://www.feiesoft.com/doc/1374772887.html <?php //ODBC連接Excel數據庫（myExcel.xls）： //resource odbc_connect ( string $d

波特王子

2020-07-06 10:45:57

Oracle創建所有表的同義詞

Oracle下A用戶需要訪問B用戶的表，所有表都需要用B.table_name的模式訪問，可以在A用戶下創建B用戶所有表的同義詞： select 'create synonym '|| object_name || ' for ' ||

波特王子

2020-07-06 10:45:56

國產數據庫OushuDB適配中國統一操作系統UOS

2020年5月29日，偶數科技旗下產品OushuDB完成了和國產操作系統——統一操作系統UOS的適配。這意味着OushuDB作爲國人完全自主研發的高性能數據庫現在可以在覈心國產硬件、操作系統中運行，打破了國外對於基礎軟硬件的壟斷，形成了

偶数科技

2020-07-02 21:00:30

數據同步工具ETL、ELT傻傻分不清楚？3分鐘看懂兩者區別

什麼是數據同步工具（ETL、ELT）數據同步工具ETL或者ELT的作用是將業務系統的數據經過抽取、清洗轉換之後加載到數據倉庫的過程，目的是將企業中的分散、零亂、標準不統一的數據整合到一起，爲企業的決策提供分析依據。數據同步是BI項目重要

偶数科技

2020-07-02 21:00:30

五大亮點升級，偶數科技數據中臺Lava 3.2新版本發佈

隨着疫情的離去，近期偶數科技也更新了數據中臺產品Lava 的3.2版本。本次發佈主要在如下五個方面做了優化：更強大的數據同步工具WASP 數據同步工具是數據中臺必備的工具之一，WASP負責同步異構的業務數據到數據中臺，以構建數據倉庫，

偶数科技

2020-07-02 21:00:30

機器學習平臺再進化，偶數科技發佈LittleBoy 3.0

近日，偶數科技正式發佈了機器學習平臺LittleBoy的3.0版本。新版本進一步擴展了LittleBoy機器學習平臺的深度和廣度，提升了模型支持複雜度和種類。在不影響“導航式建模”易用性的前提下，AI模型訓練過程中的每一步都增加了拓展功

偶数科技

2020-07-02 21:00:30

使用navicat或SQLyog訪問內網數據庫

問題: 本地電腦無法訪問或者無權限訪問數據庫，數據庫在服務端中的內環環境，必須通過跳板機的方式訪問解決: 通過SSH連接服務器 navicat下(如果出現SSH:expected key exchange group packet fo

一只臭狮子

2020-06-30 21:11:57

使用C#連接ORACLE數據庫 2

一、使用OracleClient組件連接Oracle .Net框架的System.Data.OracleClient.dll組件（ADO.Net組件），爲連接和使用Oracle數據庫提供了很大的方便。 1、使用客戶端網絡

Manarty

2020-06-30 16:38:49

SQL Server導入性能對比（1）——WITH TABLOCK並行導入

隨着大數據和大量數據系統的出現，數據的加載變得越來越重要，很多崗位甚至只需要ETL技能，不過今時今日數據加載已經不再是單純的ETL，還有ELT，甚至不需要進行數據移動的計算等等。本文先把精力放在傳統的ETL上。介紹幾種數據加載

發糞塗牆

2020-06-30 05:42:46

VUE+Node宿舍管理系統學生公寓管理系統開發分享

介紹老婆學校要外包給我一個學生宿舍管理系統開發，特地在此跟大家分享一下開發過程，幫助大家增長開發經驗開發技術 Vue、ElementUi、NodeJS、Koa2、Mysql 創新點 1.前後端分離 2.可視化echarts 3

卫星Cannos168

2020-06-29 15:44:45

Oracle數據庫操作（pro*c/c++方式）

//============================================================================ // Name : CExercise.pc // Aut

你好红孩儿

2020-06-28 22:36:49

mysql數據庫文件操作

//============================================================================ // Name : CExercise.cpp // Author

你好红孩儿

2020-06-28 22:36:48

SQL Server 2012無法使用Windows身份驗證登陸

SQL Server 2012安裝時設置的身份驗證模式爲“混合模式（SQL Server 身份驗證和Windows身份驗證）（M）”，安裝成功後卻只能使用“SQL Server 身份驗證”登陸,使用Windows身份驗證模式卻提示無法連接

danforn

2020-06-28 00:31:16

24小時熱門文章

千萬級別數據實時複雜統計效率優化

千萬級別數據實時複雜統計效率優化

springboot如何多線程異步執行定時任務

Android adb LOGCAT顯示中文

Sql Server 2005 與Sql Server Mobile(Sql server 2005 mobile Edition)數據同步步驟以及問題解決方案

Android實現3個圓圈的動畫

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結