大数据闯关之MySQL基础篇(四):DQL数据查询操作
写在前面
大家好,这里是立志于在有生之年看到并参与通用人工智能开发工作的Nobody,由于最近在公司要经常性地接触大数据工具,所以打算开一个大专栏对大数据工具进行学习总结整理。
以下是这个系列的前置博客
一、基础查询
-
DQL基础查询语法
SELECT 字段列表 FROM 表名列表 WHERE 条件列表 GROUP BY 分组字段列表 HAVING 分组后条件列表 ORDER BY 排序字段列表 LIMIT 分页参数
为了查看效果,先创建一张表,并向表中插入数据
create table emp( id int comment '编号', workno varchar(10) comment '工号', name varchar(10) comment '姓名', gender char(1) comment '性别', age tinyint unsigned comment '年龄', idcard char(18) comment '身份证号', workaddress varchar(50) comment '工作地址', entrydate date comment '入职时间' ) comment '员工表'; insert into emp (id, workno, name, gender, age, idcard,workaddress, entrydate) values (1,'1','柳岩','女',20,'123456789012345678','北京','2000-01-01'), (2,'2','张无忌','男',18,'123456789012345670','北京','2005-09-01'), (3,'3','韦一笑','男',38,'123456789712345670','上海','2005-08-01'), (4,'4','赵敏','女',18,'123456757123845670','北京','2009-12-01'), (5,'5','小昭','女',16,'123456769012345678','上海','2007-07-01'), (6,'6','杨道','男',28,'12345678931234567X','北京','2006-01-01'), (7,'7','范瑶','男',40,'123456789212345670','北京', '2005-05-01'), (8,'8','黛绮丝','女',38,'123456157123645670','天津','2015-05-01'), (9,'9','范凉凉','女',45,'123156789012345678','北京','2010-04-01'), (10,'10','陈友谅','男',53,'123456789012345670','上海','2011-01-01'), (11,'11','张士诚','男',55,'123567897123465670','江苏','2015-05-01'), (12,'12','常遇春','男',32,'123446757152345670','北京','2004-02-01'), (13,'13','张三丰','男',88,'123656789012345678','江苏','2020-11-01'), (14,'14','灭绝','女',65,'123456719012345670','西安','2019-05-01'), (15,'15','胡青牛','男',70,'12345674971234567X','西安','2018-04-01'), (16,'16','周芷若','女',18,null,'北京','2012-06-01');
查询多个字段
SELECT 字段1,字段2,... FROM 表名 SELECT * FROM 表名
设置别名
SELECT 字段1 [AS 别名1],字段2 [AS 别名2],... FROM 表名
去除重复记录
SELECT DISTINCT 字段列表 FROM 表名
-
条件查询
SELECT 字段列表 FROM 表名 WHERE 条件列表
条件
比较运算符 功能 大于 >= 大于等于 < 小于 <= 小于等于 = 等于 <>或 != 不等于 BETWEEN ... AND ... 在某个范围之内(含最小、最大值) IN(...) 在in之后的列表中的值,多选一 LIKE 占位符 模糊匹配(_匹配单个字符,%匹配任意个字符) IS NULL 是NULL 逻辑运算符 功能 AND 或 && 并且 OR 或 || 或者 NOT 或 ! 非,不是
三、聚合函数
-
聚合函数:将一列数据作为一个整体,进行纵向计算
函数 功能 count 统计数量 max 最大值 min 最小值 avg 平均值 sum 求和 SELECT 聚合函数(字段列表) FROM 表名;
四、分组查询
-
语法
SELECT 字段列表 FROM 表名 [WHERE 条件] GROUP BY 分组字段名 [HAVING 分组后过滤条件];
-
where和having区别
- 执行实际不同:where是分组之前进行过滤,不满足where条件,不参与分组;而having是分组之后对结果进行过滤
- 判断条件不同:where不能对聚合函数进行判断,而having可以
-
注意
- 执行顺序:where>聚合函数>having
- 分组之后,查询的字段一般为聚合函数和分组字段,查询其他字段无任何意义
五、排序查询
-
语法
SELECT 字段列表 FROM 表名 ORDER BY 字段1 排序方式1, 字段2 排序方式2;
-
排序方式
- asc:升序(默认值)
- DESC:降序
-
注意:如果是多字段排序,当第一个字段值相同时,才会根据第二个字段进行排序
六、分页查询
-
语法
SELECT 字段列表 FROM 表名 LIMIT 起始索引, 查询记录数;
-
注意
- 起始索引从0开始,起始索引=(查询页码-1)*每页显示记录数
- 分页查询是数据库的方言,不同的数据库有不同的实现,MySQL是LIMIT
- 如果查询的是第一页数据,起始索引可以省略,直接简写为limit 10
七、执行顺序
与编写顺序不同,执行顺序如下:
FROM
表名列表
WHERE
条件列表
GROUP BY
分组字段列表
HAVING
分组后条件列表
SELECT
字段列表
ORDER BY
排序字段列表
LIMIT
分页参数
八、案例练习
现在来做一个小练习,按照需求完成如下DQL语句编写
-
查询年龄为20,21,22,23岁的员工信息
SELECT * FROM emp where age = 20 || age = 21 || age = 22 || age = 23;
-
查询性别为男,并且年龄在20-40岁(含)以内的姓名为三个字的员工
SELECT * FROM emp WHERE gender = '男' AND 20 <= age <= 40 AND name LIKE '___';
-
统计员工表中,年龄小于60岁的,男性员工和女性员工的人数
SELECT gender, count(*) FROM emp WHERE age < 60 GROUP BY gender;
-
查询所有年龄小于等于35岁员工的姓名和年龄,并对查询结果按年龄升序排序,如果年龄相同按入职时间降序排序
SELECT name, age FROM emp WHERE age <= 35 ORDER BY age, entrydate DESC;
-
查询性别为男,且年龄在20-40岁(含)以内的前5个员工信息,对查询的结果按年龄升序排序,年龄相同按入职时间升序排序
SELECT * FROM emp WHERE gender = '男' AND 20 <= age <= 40 ORDER BY age, entrydate LIMIT 0, 5;
转载自:https://juejin.cn/post/7270028440035262519