MySQL如何使用GROUPBY_MySQL分组查询与聚合函数应用教程(分组.如何使用.函数.聚合.教程...)

wufei123 发布于 2025-09-02 阅读(5)
GROUP BY用于按列分组数据并执行聚合计算,如SUM、COUNT、AVG等;HAVING用于过滤分组后的结果,而WHERE在分组前过滤原始数据,执行顺序为先WHERE、再GROUP BY、最后HAVING。

mysql如何使用groupby_mysql分组查询与聚合函数应用教程

在MySQL中,

GROUP BY
子句是进行数据聚合和分析的核心,它允许你根据一个或多个列的值将数据行分组,然后对每个组执行像求和、计数、平均值这样的聚合操作。简单来说,当你需要从海量数据中提炼出某个类别或维度下的汇总信息时,
GROUP BY
就是你的得力工具,它能帮助你快速理解数据的整体趋势和特征。

使用

GROUP BY
实际上是数据库查询中一个非常强大的模式,它让我们从“看单个数据”转变为“看数据群体特征”。最基本的用法是这样的:你选择一些列作为分组的依据,然后选择一个或多个聚合函数来计算每个组的汇总值。

比如,我有一个

orders
表,里面有
customer_id
,
order_date
,
amount
。如果我想知道每个客户的总消费额,我不会去遍历每一条订单然后手动加起来,那太低效了。我会这样写:
SELECT
    customer_id,
    SUM(amount) AS total_spent
FROM
    orders
GROUP BY
    customer_id;

这里,

customer_id
就是我们的分组依据。数据库会找到所有
customer_id
相同的行,把它们归到同一个“桶”里,然后对每个桶里的
amount
值进行
SUM
操作。结果就是每个客户一行,显示他们的ID和总消费。

有时,你可能需要更细致的分组,比如想看每个客户在不同月份的消费情况。这时,

GROUP BY
后面就可以跟多个列:
SELECT
    customer_id,
    DATE_FORMAT(order_date, '%Y-%m') AS order_month,
    SUM(amount) AS monthly_spent
FROM
    orders
GROUP BY
    customer_id,
    order_month
ORDER BY
    customer_id, order_month;

这里要注意一点,

SELECT
语句中除了聚合函数的结果,通常只能出现
GROUP BY
子句中包含的列。这是SQL的一个基本原则,因为如果你选了一个没有分组的列,数据库就不知道在每个组里应该显示哪个值了。比如说,一个客户有多笔订单,每笔订单的
order_id
都不同,如果你
SELECT customer_id, order_id, SUM(amount) FROM orders GROUP BY customer_id;
,那么对于一个客户的多个
order_id
,数据库就不知道该选哪个
order_id
来代表这个分组了,这通常会导致错误或者非预期的结果(在某些数据库版本或配置下可能会返回任意一个值,但这不是我们想要的)。

还有,筛选分组后的数据,我们用

HAVING
而不是
WHERE
WHERE
是在分组发生之前过滤原始行,而
HAVING
是在分组和聚合之后,对聚合结果进行过滤。比如,我想找出总消费超过1000元的客户:
SELECT
    customer_id,
    SUM(amount) AS total_spent
FROM
    orders
GROUP BY
    customer_id
HAVING
    total_spent > 1000;

如果我想先过滤掉某个日期前的订单,再进行分组和聚合,那么

WHERE
HAVING
可以一起用:
SELECT
    customer_id,
    SUM(amount) AS total_spent
FROM
    orders
WHERE
    order_date >= '2023-01-01' -- 先过滤2023年之前的订单
GROUP BY
    customer_id
HAVING
    total_spent > 500; -- 再过滤总消费低于500的客户

这展示了它们各自的作用范围和执行顺序。

MySQL GROUP BY 语句中常用的聚合函数有哪些?

在使用

GROUP BY
进行数据分组时,聚合函数是不可或缺的,它们负责对每个组内的数据进行计算,然后返回一个单一的结果。理解这些函数的功能和应用场景,能让我们更灵活地从数据中提取价值。我通常会用到以下几种:
  • COUNT()
    : 这是最常用的,用于计算组中的行数。
    • COUNT(*)
      :计算组内所有行的数量,包括含有NULL值的行。
    • COUNT(column_name)
      :计算指定列非NULL值的行数。如果你想知道某个字段有多少个非空值,这个就很有用。
    • COUNT(DISTINCT column_name)
      :计算指定列中不重复的非NULL值的数量。比如,我想知道某个部门有多少个不同的职位。
    -- 计算每个部门的员工总数
    SELECT department_id, COUNT(*) AS total_employees
    FROM employees
    GROUP BY department_id;
    
    -- 计算每个部门有多少个不同的职位
    SELECT department_id, COUNT(DISTINCT job_id) AS distinct_jobs
    FROM employees
    GROUP BY department_id;
  • SUM()
    : 计算指定列(通常是数值类型)的总和。
    • 这个函数在财务、销售数据分析中尤其重要,比如计算总销售额、总库存价值等。
    -- 计算每个产品的总销售额
    SELECT product_id, SUM(quantity * price) AS total_sales
    FROM order_items
    GROUP BY product_id;
  • AVG()
    : 计算指定列(数值类型)的平均值。
    • 分析平均消费、平均薪资、平均分数等场景。
    -- 计算每个部门的平均薪资
    SELECT department_id, AVG(salary) AS average_salary
    FROM employees
    GROUP BY department_id;
  • MAX()
    MIN()
    : 分别计算指定列的最大值和最小值。
    • 这两个函数不仅限于数值类型,也可以用于日期、字符串类型,比如找出最早/最晚的订单日期,或者按字母顺序排在最前/最后的商品名称。
    -- 找出每个客户的最高消费订单金额和最低消费订单金额
    SELECT customer_id, MAX(amount) AS max_order_amount, MIN(amount) AS min_order_amount
    FROM orders
    GROUP BY customer_id;
    
    -- 找出每个部门最早入职的员工日期
    SELECT department_id, MIN(hire_date) AS earliest_hire_date
    FROM employees
    GROUP BY department_id;

除了这些,还有像

GROUP_CONCAT()
(将组内字符串连接起来)、
VAR_POP()
,
STDDEV_POP()
(计算方差和标准差)等,它们在特定场景下也非常有用。关键是根据你的分析目标,选择最合适的聚合函数。有时候,一个复杂的业务问题,可能需要组合多个聚合函数才能得到答案。 理解GROUP BY与HAVING子句的执行顺序和区别

很多初学者在使用

GROUP BY
时,经常会混淆
WHERE

以上就是MySQL如何使用GROUPBY_MySQL分组查询与聚合函数应用教程的详细内容,更多请关注知识资源分享宝库其它相关文章!

标签:  分组 如何使用 函数 

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。