窗口函数,说白了,就是在SQL查询中,让你能在每一行数据旁边,加上一些“额外的统计信息”。它不像 GROUP BY 那样会改变行的数量,而是保持原有行数不变,只是多了几列“窗口”计算出来的结果。RANK 和 ROWNUMBER 算是窗口函数里比较常用的了,它们主要用来进行排序。
SQL窗口函数,主要就是为了在查询结果中,既能看到明细数据,又能看到基于这些数据计算出来的聚合结果。
RANK、ROWNUMBER的应用:直接在SELECT语句中使用 OVER() 子句来定义窗口。OVER() 子句里面可以指定PARTITION BY(分组)和ORDER BY(排序)子句。
窗口函数与GROUP BY的区别是什么?GROUP BY 会将数据按照指定的列进行分组,然后对每个组进行聚合计算,最终返回每个组的聚合结果,行的数量会减少。而窗口函数不会改变行的数量,它只是在每一行旁边添加一些基于窗口的计算结果。简单来说,GROUP BY 是用来做聚合的,窗口函数是用来做“增强”的。
举个例子,你想统计每个部门的平均工资,并显示每个员工的工资和部门平均工资。用 GROUP BY 只能得到每个部门的平均工资,看不到每个员工的工资。但用窗口函数,就能同时看到每个员工的工资和该员工所在部门的平均工资。
SELECT employee_name, salary, AVG(salary) OVER (PARTITION BY department_id) AS department_avg_salary FROM employees;
这个例子中,
AVG(salary) OVER (PARTITION BY department_id)就是一个窗口函数。
PARTITION BY department_id表示按照部门分组,
AVG(salary)计算每个部门的平均工资。结果集中,每一行都会显示员工姓名、工资和该员工所在部门的平均工资。 RANK 和 ROWNUMBER 的具体用法及区别?
RANK 和 ROWNUMBER 都是用来给结果集中的行进行排序的,但它们的行为略有不同。
ROWNUMBER(): 简单粗暴地给每一行分配一个唯一的序号,从1开始,按照ORDER BY子句指定的顺序递增。即使ORDER BY的列有相同的值,ROWNUMBER() 也会分配不同的序号。
RANK(): 会考虑ORDER BY子句中相同的值。如果两行的排序值相同,RANK() 会给它们分配相同的排名,并跳过后续的排名。例如,如果有两行排名都是第2,那么下一行的排名就是第4,而不是第3。
-- ROWNUMBER() 示例 SELECT product_name, price, ROW_NUMBER() OVER (ORDER BY price DESC) AS row_num FROM products; -- RANK() 示例 SELECT product_name, price, RANK() OVER (ORDER BY price DESC) AS rank_num FROM products;
假设
products表中有三条数据:

全面的AI聚合平台,一站式访问所有顶级AI模型


ROWNUMBER() 的结果会是:
RANK() 的结果会是:
可以看到,ROWNUMBER() 给每个产品都分配了唯一的序号,而 RANK() 给价格相同的产品分配了相同的排名。
如何在实际业务场景中使用窗口函数进行数据分析?窗口函数在数据分析中有很多实际应用场景,例如:
- 计算移动平均值: 比如计算过去7天的销售额的移动平均值,可以平滑数据,更好地观察趋势。
- 计算累计总和: 比如计算每个月的累计销售额,可以了解销售额的增长情况。
- 查找每个类别中的Top N: 比如查找每个地区销售额最高的3个产品。
- 计算百分比排名: 比如计算每个学生的成绩在班级中的百分比排名。
下面是一个计算移动平均值的例子:
SELECT sale_date, sale_amount, AVG(sale_amount) OVER (ORDER BY sale_date ASC ROWS BETWEEN 6 PRECEDING AND CURRENT ROW) AS moving_avg FROM sales;
ROWS BETWEEN 6 PRECEDING AND CURRENT ROW指定了窗口的大小,表示计算当前行和前6行的平均值。这个查询可以帮助你分析销售额的趋势。
再比如,找出每个部门工资最高的员工:
SELECT department_id, employee_name, salary FROM ( SELECT department_id, employee_name, salary, RANK() OVER (PARTITION BY department_id ORDER BY salary DESC) AS rank_num FROM employees ) AS subquery WHERE rank_num = 1;
这个例子中,先用窗口函数计算每个员工在部门内的工资排名,然后筛选出排名为1的员工,即工资最高的员工。
窗口函数的功能很强大,掌握了它,可以让你在SQL查询中更加灵活地进行数据分析。
以上就是如何在SQL中使用窗口函数?RANK、ROWNUMBER的应用的详细内容,更多请关注知识资源分享宝库其它相关文章!
相关标签: 区别 sql select 数据分析 大家都在看: SQL临时表存储聚合结果怎么做_SQL临时表存储聚合数据方法 SQL查询速度慢如何优化_复杂SQL查询性能优化十大方法 AI运行MySQL语句的方法是什么_使用AI操作MySQL数据库指南 SQL注入如何影响API安全?保护API端点的策略 SQL注入如何影响API安全?保护API端点的策略
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。