likes
comments
collection
share

场景设计题:如何设计一个排行榜

作者站长头像
站长
· 阅读数 5

前言

大家好,我是田螺

最近有位星球粉丝问:田螺哥,如何设计一个排行榜?

日常开发中,我们经常需要涉及设计排行榜的需求,如礼物排行榜、微信运动排行、王者荣耀段位排行榜等等。今天我带大家聊聊,排行榜如何设计。

  • 关注公众号:捡田螺的小男孩 (可领原创面试资料)

场景设计题:如何设计一个排行榜

数据库的order by

很多小伙伴,一提到排行榜,就想到数据库的order by

其实这个思路是没有错的,我们假设用order by来实现一个简单的微信运动步数排行榜。

假设表结构如下:

CREATE TABLE `user_info` (
   `id` int NOT NULL AUTO_INCREMENT,
   `user_name` varchar(255) DEFAULT NULL,
   `age` int DEFAULT NULL,
   `step` int DEFAULT 0 comment '步数',
   `picture_url` varchar(255) DEFAULT NULL comment '头像url',
   PRIMARY KEY (`id`)
 ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb3

这时候要实现一个微信步数排行版,不是有手就行嘛:

select * 
from user_info
order by step desc 

这个实现没有问题的,如果表的数据量少的话,反而推荐这样实现。如果数据量多呢?

我们先来造一千万数据。

    for (int i = 0; i < 10000000; i++) {
            UserInfo record = new UserInfo();
            record.setUserName("user" + i);
            record.setAge(10);
            record.setUserName("userName" + i);
            record.setStep(new Random().nextInt(1000) * 1000);
            record.setPictureUrl("https://tianluo/picture/"+i+".jpg");
            userInfoDao.insertUserInfo(record);
        }

我们现在查询步数前1000的用户,SQL如下:

select * 
from user_info
order by step desc limit 0,1000;

然后看下耗时,set @@profiling=1;,show profiles;

场景设计题:如何设计一个排行榜

可以发现耗时14秒多,这个耗时太久了,这种情况,我们可以添加索引优化它。

ALTER TABLE user_info ADD INDEX idx_step (step);

添加完索引之后,发现再去查步数前1000的用户,0.005秒:

场景设计题:如何设计一个排行榜

这时候感觉,order by做分页也挺好的。但是这个是你加了索引和限制排序条数的前提下啦。

实际上,当数据量较小且查询不频繁时,可以使用 MySQL 的 order by来实现排行榜。而当数据量较大且需要实时更新并频繁查询时,使用 Redis 的有序集合更为适合。

Redis 的 zset

有序集合zsetRedis 提供的一种数据结构,它类似于集合(set),但每个成员都关联着一个分数(score),Redis 使用这个分数来对集合中的成员进行排序。

大家可以看看官网对它的简介哈:

https://redis.io/commands/zadd/#sorted-sets-101

场景设计题:如何设计一个排行榜

我们继续搞一个微信运动排行版。假设redis的key是 run:ranking,然后小明的步数是1000,小华的步数是3000,小红的步数是2000,小李的步数是4000步,我们可以用zadd添加到redis,如下:

zadd run:ranking 1000 “小明”
zadd run:ranking 3000 “小华”
zadd run:ranking 2000 “小红”
zadd run:ranking 4000 “小李”

我们用这个命令,就可以输出排行榜啦:

ZREVRANGE run:ranking 0 -1 WITHSCORES
  • ZREVRANGE 表示从大到小排序
  • ZRANGE 表示从小到大排序
  • ZADD key score1 member1 score2 member2…表示向集合中添加元素

它在Redis类似这样保存的:

场景设计题:如何设计一个排行榜

如果在redis中的score分数相同,它是如何排序的呢?

在 Redis 的有序集合(Sorted Set)中,如果多个成员具有相同的分数,则它们按照字典顺序进行排序。具体来说,当有多个成员具有相同的分数时,Redis 会根据成员的字典顺序(lexicographical order)对它们进行排序。

字典顺序是一种字符串比较的方式,它按照字母表的顺序进行排序。对于 ASCII 字符集,字母表的顺序是 A-Z,a-z,数字的顺序是 0-9。如果成员具有相同的分数,那么它们将按照它们的字典顺序进行排列。

例如,假设有一个名为 myset 的有序集合,包含了以下成员和分数:

"a" - 1000
"b" - 2000
"c" - 2000
"d" - 3000

在这个示例中,成员 "b" 和 "c" 具有相同的分数 2000。当使用 ZRANGE 或 ZREVRANGE 命令来查看有序集合的成员时,它们将按照字典顺序进行排列。因此,成员 "b" 将在成员 "c" 的前面,因为 "b" 的字典顺序小于 "c"。

如果每个人看到的排行榜,都是一样的,类似上面的处理就可以啦。如果每个人看到的排行榜不一样的,我们则可以在redis zsetkey,加上用户标志,比如userId即可。

使用 Redis 的有序集合作为排行榜,也有一些问题需要注意哈

  • 内存消耗: 有序集合中的数据会存储在 Redis 的内存中。如果排行榜的数据量非常大,可能会占用大量的内存资源,导致 Redis 实例的内存使用率增加。
  • 数据更新频繁: 如果排行榜的数据需要频繁更新,例如每秒钟都有大量的用户分数变化,这可能会导致 Redis 的写入负载增加,影响系统的性能。
  • 网络开销: 如果客户端需要频繁地向 Redis 发送更新排行榜数据的请求,可能会增加网络开销,尤其是在高并发的情况下。
  • 数据一致性: 在多个客户端同时更新排行榜数据时,可能会出现数据不一致的情况。虽然 Redis 提供了一些原子操作来确保数据的一致性,但在高并发的情况下,仍然需要注意数据一致性的问题。
  • 持久化: 默认情况下,Redis 将数据存储在内存中,并且可以通过持久化功能将数据写入磁盘。但是,使用持久化功能可能会影响 Redis 的性能,并增加系统的负载。
  • 高可用性: 如果 Redis 实例发生故障或者网络中断,可能会影响排行榜的可用性。为了确保排行榜的高可用性,需要考虑使用 Redis 的主从复制、哨兵模式或者集群模式来实现数据的备份和故障切换。