大数据闯关之MySQL基础篇（四）：DQL数据查询操作

站长

2024年04月06日 11:07 · 阅读数 80

写在前面

大家好，这里是立志于在有生之年看到并参与通用人工智能开发工作的Nobody，由于最近在公司要经常性地接触大数据工具，所以打算开一个大专栏对大数据工具进行学习总结整理。

以下是这个系列的前置博客

一、基础查询

DQL基础查询语法

SELECT 
	字段列表
FROM
	表名列表
WHERE
	条件列表
GROUP BY
	分组字段列表
HAVING
	分组后条件列表
ORDER BY
	排序字段列表
LIMIT
	分页参数

为了查看效果，先创建一张表，并向表中插入数据

create table emp(
    id int comment '编号',
    workno varchar(10) comment '工号',
    name varchar(10) comment '姓名',
    gender char(1) comment '性别',
    age tinyint unsigned comment '年龄',
    idcard char(18) comment '身份证号',
    workaddress varchar(50) comment '工作地址',
    entrydate date comment '入职时间'
) comment '员工表';

insert into emp (id, workno, name, gender, age, idcard,workaddress, entrydate)
values  (1,'1','柳岩','女',20,'123456789012345678','北京','2000-01-01'),
        (2,'2','张无忌','男',18,'123456789012345670','北京','2005-09-01'),
        (3,'3','韦一笑','男',38,'123456789712345670','上海','2005-08-01'),
        (4,'4','赵敏','女',18,'123456757123845670','北京','2009-12-01'),
        (5,'5','小昭','女',16,'123456769012345678','上海','2007-07-01'),
        (6,'6','杨道','男',28,'12345678931234567X','北京','2006-01-01'),
        (7,'7','范瑶','男',40,'123456789212345670','北京', '2005-05-01'),
        (8,'8','黛绮丝','女',38,'123456157123645670','天津','2015-05-01'),
        (9,'9','范凉凉','女',45,'123156789012345678','北京','2010-04-01'),
        (10,'10','陈友谅','男',53,'123456789012345670','上海','2011-01-01'),
        (11,'11','张士诚','男',55,'123567897123465670','江苏','2015-05-01'),
        (12,'12','常遇春','男',32,'123446757152345670','北京','2004-02-01'),
        (13,'13','张三丰','男',88,'123656789012345678','江苏','2020-11-01'),
        (14,'14','灭绝','女',65,'123456719012345670','西安','2019-05-01'),
        (15,'15','胡青牛','男',70,'12345674971234567X','西安','2018-04-01'),
        (16,'16','周芷若','女',18,null,'北京','2012-06-01');

查询多个字段

SELECT 字段1,字段2,... FROM 表名
SELECT * FROM 表名

设置别名

SELECT 字段1 [AS 别名1],字段2 [AS 别名2],... FROM 表名

去除重复记录

SELECT DISTINCT 字段列表 FROM 表名

条件查询

SELECT 字段列表 FROM 表名 WHERE 条件列表

条件

比较运算符	功能
大于
>=	大于等于
<	小于
<=	小于等于
=	等于
<>或 !=	不等于
BETWEEN ... AND ...	在某个范围之内（含最小、最大值）
IN(...)	在in之后的列表中的值，多选一
LIKE 占位符	模糊匹配（_匹配单个字符，%匹配任意个字符）
IS NULL	是NULL

逻辑运算符	功能
AND 或 &&	并且
OR 或 \|\|	或者
NOT 或 !	非，不是

三、聚合函数

聚合函数：将一列数据作为一个整体，进行纵向计算

函数功能
count 统计数量
max 最大值
min 最小值
avg 平均值
sum 求和
```
SELECT 聚合函数(字段列表) FROM 表名;
```

函数	功能
count	统计数量
max	最大值
min	最小值
avg	平均值
sum	求和

四、分组查询

语法

SELECT 字段列表 FROM 表名 [WHERE 条件] GROUP BY 分组字段名 [HAVING 分组后过滤条件];

where和having区别
- 执行实际不同：where是分组之前进行过滤，不满足where条件，不参与分组；而having是分组之后对结果进行过滤
- 判断条件不同：where不能对聚合函数进行判断，而having可以
注意
- 执行顺序：where>聚合函数>having
- 分组之后，查询的字段一般为聚合函数和分组字段，查询其他字段无任何意义

五、排序查询

语法

SELECT 字段列表 FROM 表名 ORDER BY 字段1 排序方式1, 字段2 排序方式2;

排序方式
- asc：升序（默认值）
- DESC：降序
注意：如果是多字段排序，当第一个字段值相同时，才会根据第二个字段进行排序

六、分页查询

语法

SELECT 字段列表 FROM 表名 LIMIT 起始索引, 查询记录数;

注意
- 起始索引从0开始，起始索引=（查询页码-1）*每页显示记录数
- 分页查询是数据库的方言，不同的数据库有不同的实现，MySQL是LIMIT
- 如果查询的是第一页数据，起始索引可以省略，直接简写为limit 10

七、执行顺序

与编写顺序不同，执行顺序如下：

FROM
	表名列表
WHERE
	条件列表
GROUP BY
	分组字段列表
HAVING
	分组后条件列表
SELECT 
	字段列表
ORDER BY
	排序字段列表
LIMIT
	分页参数

八、案例练习

现在来做一个小练习，按照需求完成如下DQL语句编写

查询年龄为20，21，22，23岁的员工信息

SELECT
       *
FROM emp
where age = 20 || age = 21 || age = 22 || age = 23;

查询性别为男，并且年龄在20-40岁（含）以内的姓名为三个字的员工

SELECT
    *
FROM emp
WHERE gender = '男'
AND 20 <= age <= 40
AND name LIKE '___';

统计员工表中，年龄小于60岁的，男性员工和女性员工的人数

SELECT
    gender,
    count(*)
FROM emp
WHERE age < 60
GROUP BY gender;

查询所有年龄小于等于35岁员工的姓名和年龄，并对查询结果按年龄升序排序，如果年龄相同按入职时间降序排序
```
SELECT
    name,
    age
FROM emp
WHERE age <= 35
ORDER BY age,
         entrydate DESC;
```
查询性别为男，且年龄在20-40岁（含）以内的前5个员工信息，对查询的结果按年龄升序排序，年龄相同按入职时间升序排序
```
SELECT
    *
FROM emp
WHERE gender = '男'
AND 20 <= age <= 40
ORDER BY age, entrydate
LIMIT 0, 5;
```

转载自:https://juejin.cn/post/7270028440035262519