欢聚笔试题求助帖
事情是这样的,这段时间一直在求职投简历,期望在暑假之前接到一份大数据开发的实习工作。投了很多公司,然后就收到了欢聚的笔试邀约,HR说要我一天之内做出来,恰巧第二天还有组会要汇报,我就先放下了,打算开完组会,下午再做,也没有超时。
拿到的笔试题是一份pdf的建表语句什么的需要自己手动输入,而且建表语句中存在一些小坑。
这是需要使用hive sql回答的一份笔试题。
建表语句如下:
1、班级课后统计表--ls表
表定义的最后不应该有逗号(原表中一个最大的错误,困扰了我很久,没有发现)
2、班级信息表--ci表
3、作业统计表--hs表
4、作业报告查看记录表--re表
1. 第一题,求所有已开课的正式课班级的学生到课数据统计
解释:已开课:开课时间小于当前时间则为已开课;
正式课:class_type=20
需求列表:
具体字段如下:
我的答案:
SELECT
ci.class_id,
ci.class_no,
ci.class_name,
COUNT(DISTINCT ls.uid) AS `应到学生总数`,
SUM(IF(ls.be_attend = 10,1,0)) AS `到课学生数`,
AVG(IF(ls.be_attend = 10,ls.attend_duration,0)) `人均到课时长`
FROM
tb_class_info ci
JOIN
tb_class_lesson_stat ls
ON
ci.class_id = ls.class_id
WHERE
ci.class_type = 20 AND
ci.class_start_time < CURRENT_TIMESTAMP()
GROUP BY
ci.class_id, ci.class_no, ci.class_name;
我的思路:
求所有已开课的正式课班的学生到课数据统计,
主要是聚焦两张表,班级课后统计表--ls表和班级信息表--ci表,关联条件就是“大班ID”。这道题要说难的话,我认为有两点: 一是,字段比较难把握,但是这个其实还好,题目中已经给了需求字段,前三个字段直接写上。“应到学生数”,就是课程id关联上的,ls表中学生id,去重计数就是应到学生数了;“到课学生数”,在ls表中有个字段“be_attend”为“10”时,对满足条件的行求和就是“应到学生数”了;“人均到课时长”,是用到avg函数,当“be_attend”为“10”时,加上“ls.attend_duration”字段数值,也就是到课时长,否则就加0。
二是,已开课如何表示?题目中已经提示了,时间小于现在时间,如何表示现在的时间了,sql中与时间相关的函数是date,timestamp类似的单词,在这里我用到的是current_timestamp。
至此,拼接上述思路,我的答案就出来了,对了记得group by一下班级,为了准确度,同时分组一下班级id、班级no和班级名。
2. 第二题, 求到课用户的课后作业完成情况
需求字段如下:
我的答案:
SELECT
ci.class_id,
ci.class_no,
ci.class_name,
COUNT(DISTINCT ls.uid) AS `到课学生数`,
COUNT(DISTINCT CASE WHEN (hs.push_status = 1 OR hs.push_status = 2) THEN hs.uid ELSE NULL END) AS `下发作业学生数`,
COUNT(DISTINCT CASE WHEN (hs.status = 20 OR hs.status = 10) THEN hs.uid ELSE NULL END) AS `完成作业学生数`,
COUNT(DISTINCT CASE WHEN hs.push_status = 2 THEN hs.uid ELSE NULL END) AS `下发报告学生数`,
COUNT(DISTINCT CASE WHEN re.report_type = 1 THEN re.uid ELSE NULL END) AS `查看报告学生数`
FROM
tb_class_info ci
JOIN
tb_class_lesson_stat ls ON ci.class_id = ls.class_id AND ls.be_attend = 10
LEFT JOIN
tb_homework_stu_stat hs ON ci.class_id = hs.class_id AND hs.type = 0
LEFT JOIN
tb_report_expo re ON ci.class_id = re.class_id
GROUP BY
ci.class_id, ci.class_no, ci.class_name;
求到课(ls.be_attend = 10)用户的课后作业(hs.type=0)完成情况。
我的思路:
这一题虽然看起来很复杂,应该是要连接四张表,才可以知道用户的课后作业的各种情况,而且需求字段看起来也好复杂的。别急慢慢来,一个一个看,而且需求字段中,其实已经提示我们字段所在位置,以及属性值。
(上个题目说过的字段就不在重复说了)
“下发作业学生数”:hs.push_status字段的值为1和0,在这里,我用到了一个case when函数,如果满足条件,就输出hs.uid,否则输出NULL,然后对所有的uid去重求和就可以了。
其实剩余所有的字段都可以有相同的方法求出来,我的方法就是这么做的。
3. 第三题, 求每个学生首个上课的正式课信息
即每个学⽣第⼀次上的正式课,根据上课时间排序,取第⼀个。例如⼀个学⽣2023801,2023802,
2023803分别上了课,只需保留2023801那节课的class_id、class_no等信息。
需求字段如下:
SELECT
uid,
first_lesson_month,
class_id,
class_no,
class_name
FROM (
SELECT
ls.uid,
DATE_FORMAT(ci.class_start_time, 'yyyy-MM') AS first_lesson_month,
ci.class_id,
ci.class_no,
ci.class_name,
ROW_NUMBER() OVER(PARTITION BY ls.uid ORDER BY ci.class_start_time) as rn
FROM
tb_class_lesson_stat ls
JOIN
tb_class_info ci
ON ls.class_id = ci.class_id AND ci.class_type = 20
) t
WHERE
t.rn = 1;
求每个学生首个上课的正式课信息
我的思路:
“首个”上课信息,我一开始并不知道如何解决,百度了一下知道可以用min函数或者排序函数就行了,还有开课的月份,对于时间如何转变为年月呢。首先对于uid使用row_number开窗函数,按开课时间排序,然后排序为1的这一行就可以了。然后select出需求字段的值就行。
4. ps:后记
发这篇求助帖,第一个原因是因为笔试没有通过,我也不知道正确的答案是什么,希望有大神看到可以告诉我一下我错在哪里了,好让我可以改正一下(球球了🥺)。虽然我问了HR可否发一下正确答案,但是HR可能怕答案泄漏并没有发我。
第二个原因是想记录一下我第一次参加笔试,虽然是凉了。没事继续刷题吧,主要是自己的功夫还没有到家。
小刘,要继续加油呀
转载自:https://juejin.cn/post/7369509651517423651