MySQL key重复下按某字段排序

原創

2020-02-25 07:10

有一个表（user_record），可能有百万条记录，大致内容如下：

no    uid   s
================
1       a   999
2       b    899
3       c   1234
4       a    1322
5       b    933
-----------------

uid可以重复。现在要做的是按‘s’倒序（desc）排，找出前10个不重复的uid记录，结果中要包括uid和s。

麻烦一点的做法是分两步来做：

SELECT distinct(uid) FROM user_record ORDER BY s DESC LIMIT 10
SELECT uid,s FROM user_record WHERE uid IN(Just Results)

如下是用一条语句来处理：

SELECT  uid, MAX(s) max_s
FROM    user_record
GROUP   BY uid
ORDER   BY max_s DESC
LIMIT   10

以上两个方法性能上差不多，一般我们会对uid做索引，所以速度还可以。但是如果这个表比较大的话，就会比较慢了。我试过，在有200万条记录的情况下大概需要7~8秒，300万条记录大概要10~11秒。还是要对整个表扫描的。

当然也有一个变通的方法，比如你确定这个s字段是相对独立的样本，我们可以取前100（或1000）条记录，再从中找出不重复的uid的记录

SELECT * FROM (SELECT uid,s FROM user_record 
 ORDER BY s DESC LIMIT 100) as tb
GROUP BY tb.uid 
ORDER BY tb.s DESC
LIMIT 10

这个就会很快了，不过不能确保前100条中有10个不重复的uid

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

最新美团面试集合（一面+二面+三面+重点技术面试题）附面试解析

一面 1. 簡短自我介紹 2. 事務的ACID，其中把事務的隔離性詳細解釋一遍 3. 髒讀、幻影讀、不可重複讀 4. 紅黑樹、二叉樹的算法 5. 平常用到哪些集合類？ArrayList和LinkedList區別？HashMap內部數據結構

2023-10-10 01:43:49

ORDER BY id 为何效率不高

ORDER BY id 爲何效率不高背景系統代碼中有以下查詢SQL，DBA要求優化； SELECT id, user_id, patient_id, his_id, bill_no, log_model FROM platfom_fee

2023-09-30 22:32:45

Linux环境下的主流技术部署（基于Docker容器）

搞了臺阿里雲服務器，準備學習下基於Docker容器的各種主流技術部署，那麼讓我們愉快的開始吧！ Docker環境安裝安裝yum-utils：yum install -y yum-utils device-mapper-pe

2023-02-25 00:27:07

MySQL探秘(四):InnoDB的磁盘文件及落盘机制

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

程序员历小冰

2021-12-08 12:33:52

Oracle 大佬离职，怒喷 MySQL “糟糕的数据库”

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-07 19:58:57

如何使用 MySQL 慢查询日志进行性能优化 - Profiling、mysqldumpslow 实例详解

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-24 16:08:53

腾讯云窦贤明：单一数据库不能解决所有问题

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-15 15:28:51

全网播放超 5亿的秒级实时台网互动是如何实现的？

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

PingCAP技术团队

2021-11-15 15:03:49

API网关Kong实战

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"1.Kong介紹",

2021-10-18 13:23:55

独一无二的「MySQL调优金字塔」相信也许你拥有了它，你就很可能拥有了全世界。

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":1},"content":[{"type":"text","text":"開發俏皮話","at

2021-10-14 11:03:55

Linux 系统安装mysql过程记录

Linux 系統安裝mysql過程記錄資源清單 1 mysql mysql-5.6.37-linux-glibc2.12-x86_64.tar.gz 2 linux CentOS release 6.9 (Fin

2021-09-11 21:14:10

数据迁移同步平台CloudCanal免费社区版正式发布

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragr

2021-08-06 15:13:50

线程池参数原理及应用

線程池原理 Java創建一個線程很方便，只需new Thread()就可以，但是當有多個任務需要進行進行處理時，頻繁的進行創建和啓用線程同樣需要系統開銷，也不利於管理，於是同mysql的連接池一樣，自然有對線程的管理池即線程池。

2021-07-03 21:23:32

MySQL 亿级数据分页的优化

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"背景","attrs

2021-06-11 10:44:00

MySQL 数据实时同步到 Elasticsearch的技术方案选型和思考

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"前言"}]},{"t

2021-03-23 14:43:53

24小時熱門文章

lightdb hash index的性能和限制

最新文章

最新評論文章