mysql中日期函数如何使用

P粉602998670

发布时间：2025-09-25 10:41:01

1044人浏览过

来源于php中文网

原创

MySQL日期函数可高效处理时间数据，核心包括获取当前时间、格式化、计算、提取和转换。高级用法涵盖按周期聚合、同期对比、用户留存分析，需避免在索引列使用函数导致性能下降，推荐用范围查询、冗余列优化，并结合窗口函数与CTE实现复杂时间序列分析。

mysql中日期函数如何使用

MySQL中的日期函数是数据库操作中不可或缺的一部分，它们提供了一套强大的工具集，用于处理、格式化、计算和比较日期与时间数据。无论是简单的日期获取，还是复杂的时间序列分析，这些函数都能帮助我们高效地管理时间维度的数据。

在使用MySQL日期函数时，核心在于理解它们各自的功能和参数，并根据实际需求选择最合适的函数。这不仅仅是语法层面的问题，更多的是一种数据处理的哲学：如何将现实世界中的时间概念，准确、高效地映射到数据库操作中。

解决方案

MySQL的日期函数大致可以分为几类，每类都有其独特的应用场景。我通常会从以下几个方面来思考和使用它们：

获取当前日期和时间： 这是最基础的需求。
- NOW() 或 CURRENT_TIMESTAMP()：返回当前日期和时间，格式为 'YYYY-MM-DD HH:MM:SS'。
- CURDATE() 或 CURRENT_DATE()：只返回当前日期。
- CURTIME() 或 CURRENT_TIME()：只返回当前时间。
- UNIX_TIMESTAMP()：返回当前Unix时间戳（自1970-01-01 00:00:00 UTC以来的秒数）。
示例：
```
SELECT NOW(), CURDATE(), CURTIME(), UNIX_TIMESTAMP();
```
日期和时间格式化： 将日期时间数据转换为特定格式的字符串，或者将字符串解析为日期时间。
- DATE_FORMAT(date, format)：将日期格式化为指定字符串。%Y代表四位年份，%m代表两位月份，%d代表两位日期，%H代表24小时制，%i代表分钟，%s代表秒。
- STR_TO_DATE(string, format)：将格式化的字符串解析为日期时间值。
示例：
```
SELECT DATE_FORMAT(NOW(), '%Y年%m月%d日 %H:%i:%s');
SELECT STR_TO_DATE('2023-10-26 14:30:00', '%Y-%m-%d %H:%i:%s');
```
日期和时间计算： 对日期时间进行加减操作，或者计算两个日期时间之间的差值。
- DATE_ADD(date, INTERVAL value unit) 或 ADDDATE(date, INTERVAL value unit)：增加时间。
- DATE_SUB(date, INTERVAL value unit) 或 SUBDATE(date, INTERVAL value unit)：减少时间。
- DATEDIFF(expr1, expr2)：计算两个日期之间的天数差（expr1 - expr2）。
- TIMEDIFF(expr1, expr2)：计算两个时间之间的差值。
- TIMESTAMPDIFF(unit, datetime_expr1, datetime_expr2)：计算两个日期时间之间指定单位的差值（datetime_expr2 - datetime_expr1）。unit可以是SECOND, MINUTE, HOUR, DAY, WEEK, MONTH, QUARTER, YEAR。
示例：
```
SELECT DATE_ADD(CURDATE(), INTERVAL 7 DAY); -- 一周后的日期
SELECT DATE_SUB(NOW(), INTERVAL 1 HOUR);   -- 一小时前的日期时间
SELECT DATEDIFF('2023-11-01', '2023-10-26'); -- 5
SELECT TIMESTAMPDIFF(HOUR, '2023-10-26 10:00:00', '2023-10-26 14:30:00'); -- 4
```
提取日期时间部分： 从日期时间值中提取年、月、日、小时等部分。
- YEAR(date)、MONTH(date)、DAY(date)：提取年、月、日。
- HOUR(time)、MINUTE(time)、SECOND(time)：提取小时、分钟、秒。
- WEEK(date)、WEEKOFYEAR(date)：提取周数。
- DAYOFWEEK(date) (1=Sunday, 7=Saturday)、DAYOFMONTH(date)、DAYOFYEAR(date)。
- EXTRACT(unit FROM date)：更通用的提取方式。
示例：
```
SELECT YEAR(NOW()), MONTH(NOW()), DAY(NOW());
SELECT EXTRACT(HOUR FROM '2023-10-26 14:30:00'); -- 14
```
日期时间转换： 不同类型之间的转换。
- FROM_UNIXTIME(unix_timestamp)：将Unix时间戳转换为日期时间。
- CONVERT(expr, type) 或 CAST(expr AS type)：通用类型转换，例如CAST('2023-10-26' AS DATETIME)。

这些函数构成了MySQL日期时间处理的基础。我个人在实际项目中，尤其喜欢DATE_FORMAT和DATE_ADD/DATE_SUB的组合，它们几乎能满足大部分报表和数据清洗的需求。

MySQL日期函数在数据分析中有什么高级用法？

当我们谈到高级用法，通常意味着不仅仅是简单的增删改查，而是涉及到更深层次的业务逻辑和数据洞察。在数据分析领域，MySQL的日期函数配合其他SQL特性，能发挥出令人惊喜的潜力。

一个我经常用到的场景是时间序列分析中的周期性聚合。比如，我想知道每周、每月甚至每季度的数据趋势，或者对比去年同期的数据。

按周/月/季度聚合： DATE_FORMAT在这里是利器。

-- 按周聚合，例如统计每周的订单量
SELECT
    DATE_FORMAT(order_time, '%Y-%u') AS week_of_year, -- %u 是周数，0-53，周日为一周开始
    COUNT(order_id) AS total_orders
FROM orders
GROUP BY week_of_year
ORDER BY week_of_year;

-- 按月聚合
SELECT
    DATE_FORMAT(order_time, '%Y-%m') AS month_of_year,
    SUM(amount) AS total_revenue
FROM orders
GROUP BY month_of_year
ORDER BY month_of_year;

这里 %u 和 %v 都可以表示周数，但它们的计算方式略有不同（一周从周日还是周一开始，以及第一周是否包含1月1日）。根据实际业务需求选择合适的。

同期数据对比： 这就涉及到日期计算了。比如，我想比较这个月和上个月的销售额。

SELECT
    DATE_FORMAT(current_month.order_time, '%Y-%m') AS current_month,
    SUM(current_month.amount) AS current_month_revenue,
    SUM(previous_month.amount) AS previous_month_revenue
FROM
    orders AS current_month
LEFT JOIN
    orders AS previous_month ON
    DATE_FORMAT(current_month.order_time, '%Y-%m') = DATE_FORMAT(DATE_ADD(previous_month.order_time, INTERVAL 1 MONTH), '%Y-%m')
WHERE
    current_month.order_time >= DATE_SUB(CURDATE(), INTERVAL 2 MONTH) -- 限制查询范围，提高效率
GROUP BY
    current_month
ORDER BY
    current_month;

当然，更优雅的方式可能是使用子查询或CTE（Common Table Expressions），但我更喜欢直接在JOIN条件里做日期计算，有时候它能让逻辑更直观，尤其是在处理简单的同期对比时。

计算用户生命周期或留存率： DATEDIFF和TIMESTAMPDIFF在这里非常有用。

-- 计算用户注册天数
SELECT
    user_id,
    DATEDIFF(CURDATE(), registration_date) AS days_since_registration
FROM users;

-- 计算两次购买之间的间隔（需要窗口函数或自连接）
-- 假设我们有一个用户购买记录表 user_purchases (user_id, purchase_time)
SELECT
    p1.user_id,
    p1.purchase_time AS first_purchase,
    p2.purchase_time AS second_purchase,
    TIMESTAMPDIFF(DAY, p1.purchase_time, p2.purchase_time) AS days_between_purchases
FROM
    user_purchases p1
JOIN
    user_purchases p2 ON p1.user_id = p2.user_id AND p2.purchase_time > p1.purchase_time
WHERE
    NOT EXISTS (SELECT 1 FROM user_purchases p3 WHERE p3.user_id = p1.user_id AND p3.purchase_time > p1.purchase_time AND p3.purchase_time < p2.purchase_time)
ORDER BY p1.user_id, p1.purchase_time;

这个例子稍微复杂，它尝试找到每个用户的连续两次购买间隔。在MySQL 8.0+中，使用LEAD()或LAG()这样的窗口函数会更简洁高效。

这些高级用法，本质上都是将日期函数作为构建复杂查询逻辑的基石，通过它们来定义时间窗口、计算时间差、或者格式化时间维度，从而实现对数据的多角度分析。

处理MySQL日期时常见的性能陷阱和优化策略有哪些？

在数据库操作中，性能永远是一个绕不开的话题，尤其是在处理日期和时间数据时。我见过太多因为日期函数使用不当而导致查询变慢的案例。

PHP Apache和MySQL 网页开发初步

本书全面介绍PHP脚本语言和MySOL数据库这两种目前最流行的开源软件，主要包括PHP和MySQL基本概念、PHP扩展与应用库、日期和时间功能、PHP数据对象扩展、PHP的mysqli扩展、MySQL 5的存储例程、解发器和视图等。本书帮助读者学习PHP编程语言和MySQL数据库服务器的最佳实践，了解如何创建数据库驱动的动态Web应用程序。

下载

在WHERE子句中对索引列使用函数： 这是最常见的性能杀手。
```
-- 糟糕的例子：这将导致全表扫描，即使 order_time 列有索引
SELECT * FROM orders WHERE DATE_FORMAT(order_time, '%Y-%m-%d') = '2023-10-26';
SELECT * FROM orders WHERE YEAR(order_time) = 2023 AND MONTH(order_time) = 10;
```
当你在索引列上应用函数时，数据库无法直接利用索引的B-tree结构进行快速查找，因为它需要计算每个行的函数结果，然后才能进行比较。这基本上等同于放弃了索引。

优化策略： 避免在WHERE子句的索引列上使用函数。
- 使用范围查询代替：
```
SELECT * FROM orders WHERE order_time >= '2023-10-26 00:00:00' AND order_time < '2023-10-27 00:00:00';
```
  这种方式能够充分利用order_time列上的索引。
- 如果需要按年/月/日过滤，考虑添加冗余列： 如果按年、月、日查询非常频繁，可以考虑在表中添加order_year、order_month等冗余列，并为它们创建索引。在数据写入时同步更新这些列。这是一种空间换时间的策略。
不恰当的日期时间数据类型：
- VARCHAR存储日期时间：这简直是噩梦。它不仅会增加存储空间，还会导致日期计算和比较的复杂性，并且无法利用日期时间相关的索引优化。
- 选择合适的类型：DATE（只存日期）、TIME（只存时间）、DATETIME（日期时间，不带时区信息）、TIMESTAMP（日期时间，带时区信息，范围有限制，但通常更紧凑）。TIMESTAMP在很多场景下是首选，因为它存储的是UTC时间，且占用的空间比DATETIME少。
优化策略： 始终使用MySQL提供的日期时间数据类型。
频繁的日期时间转换： 尤其是在大量数据上进行STR_TO_DATE或FROM_UNIXTIME等转换，会带来不小的开销。

优化策略：
- 提前转换： 在数据导入或ETL过程中就将数据转换为正确的日期时间类型。
- 存储正确类型： 确保源数据以正确的日期时间类型存储，避免查询时频繁转换。
复杂的日期计算在JOIN或ORDER BY子句中： 当你在JOIN条件或者ORDER BY子句中进行复杂的日期计算时，也会影响性能，特别是当涉及的表数据量很大时。

优化策略：
- 简化JOIN条件： 尽量让JOIN条件简单，直接使用索引列。如果必须进行日期计算，考虑是否能通过预处理或添加冗余列来简化。
- 优化ORDER BY： ORDER BY操作如果涉及函数，同样会阻止索引的使用。如果可能，尝试对原始的日期时间列进行排序，或者如前所述，添加冗余列并对其排序。

总之，性能优化的核心思想是：让数据库能够尽可能地利用索引，避免全表扫描，并减少不必要的计算和转换。 在处理日期时间数据时，尤其要警惕在WHERE、JOIN和ORDER BY子句中对索引列使用函数。

如何利用MySQL日期函数进行复杂的时间序列数据聚合？

复杂的时间序列数据聚合，往往需要我们从多个维度、以不同的时间粒度来审视数据。日期函数在这里扮演着“时间切片器”的角色，帮助我们将连续的时间流切割成有意义的段落。

我个人在做复杂报表时，会用到以下几种策略：

自定义时间粒度聚合： 不仅仅是按年、月、日，有时业务需要按“工作日”、“周末”、“上午”、“下午”等更细致的粒度聚合。

按工作日/周末：

SELECT
    CASE
        WHEN DAYOFWEEK(order_time) IN (1, 7) THEN '周末' -- 1是周日，7是周六
        ELSE '工作日'
    END AS time_segment,
    COUNT(order_id) AS total_orders
FROM orders
GROUP BY time_segment;

按小时段：

SELECT
    CASE
        WHEN HOUR(order_time) BETWEEN 0 AND 6 THEN '凌晨'
        WHEN HOUR(order_time) BETWEEN 7 AND 11 THEN '上午'
        WHEN HOUR(order_time) BETWEEN 12 AND 17 THEN '下午'
        ELSE '晚上'
    END AS hour_segment,
    SUM(amount) AS total_revenue
FROM orders
GROUP BY hour_segment
ORDER BY FIELD(hour_segment, '凌晨', '上午', '下午', '晚上'); -- 保证排序顺序

滑动窗口聚合（Running Totals/Moving Averages）： 这种聚合通常需要MySQL 8.0及以上版本的窗口函数（OVER())。如果版本较低，则需要通过自连接和子查询来实现，但效率会差很多。
- 计算每日销售额的3天移动平均（MySQL 8.0+）：
```
SELECT
    DATE(order_time) AS order_date,
    SUM(amount) AS daily_revenue,
    AVG(SUM(amount)) OVER (ORDER BY DATE(order_time) ROWS BETWEEN 2 PRECEDING AND CURRENT ROW) AS three_day_moving_avg
FROM orders
GROUP BY order_date
ORDER BY order_date;
```
  这里DATE(order_time)将时间戳截断到日期，然后GROUP BY聚合每天的销售额。AVG(...) OVER(...)是窗口函数的核心，它定义了一个滑动窗口（当前行和前两行），计算这个窗口内的平均值。
- 计算累计销售额（Running Total - MySQL 8.0+）：
```
SELECT
    DATE(order_time) AS order_date,
    SUM(amount) AS daily_revenue,
    SUM(SUM(amount)) OVER (ORDER BY DATE(order_time)) AS cumulative_revenue
FROM orders
GROUP BY order_date
ORDER BY order_date;
```
  这个例子中，SUM(...) OVER (ORDER BY DATE(order_time)) 会计算从第一个日期到当前日期的所有daily_revenue之和。
生成连续日期序列以填充缺失值： 在时间序列分析中，数据往往不是连续的，可能某些日期没有数据。为了进行准确的聚合和可视化，我们经常需要一个连续的日期序列。
- 结合递归CTE（MySQL 8.0+）或辅助表：
```
-- 假设我们需要生成从 '2023-10-01' 到 '2023-10-31' 的日期序列
WITH RECURSIVE dates AS (
    SELECT CAST('2023-10-01' AS DATE) AS dt
    UNION ALL
    SELECT DATE_ADD(dt, INTERVAL 1 DAY) FROM dates WHERE dt < '2023-10-31'
)
SELECT
    d.dt AS calendar_date,
    COALESCE(SUM(o.amount), 0) AS daily_revenue
FROM dates d
LEFT JOIN orders o ON d.dt = DATE(o.order_time)
GROUP BY d.dt
ORDER BY d.dt;
```
  这里RECURSIVE CTE生成了一个完整的日期序列，然后通过LEFT JOIN与订单数据关联。COALESCE用于将没有订单的日期的销售额显示为0，而不是NULL。