0

0

SQL 如何实现漏斗分析?

舞夢輝影

舞夢輝影

发布时间:2026-01-18 21:33:58

|

276人浏览过

|

来源于php中文网

原创

SQL漏斗分析核心是按顺序、时间窗口内统计各环节去重用户数并计算转化率;需定义步骤事件、用户标识、时间范围,用JOIN或条件聚合识别行为序列,注意去重、时序校验和会话切分。

sql 如何实现漏斗分析?

SQL 实现漏斗分析的核心是:按用户行为路径分步统计各环节的去重用户数,并计算相邻步骤的转化率。关键在于用 JOIN窗口函数 + 条件聚合 对同一用户在多个事件中的行为顺序进行识别和归并。

明确漏斗步骤与时间约束

漏斗不是简单统计每个事件的数量,而是要求用户按顺序、在合理时间窗口内完成一系列动作(如:浏览商品 → 加入购物车 → 提交订单 → 支付成功)。需提前定义:

  • 每一步对应的事件名或页面路径(如 event_name IN ('view_product', 'add_to_cart', 'submit_order', 'pay_success')
  • 用户标识字段(通常是 user_id,注意区分匿名 ID 和登录 ID)
  • 时间范围(如最近 7 天)和单次会话最大跨度(如 24 小时内完成才算有效路径)

用自连接匹配用户行为序列

对同一用户的多步行为,可通过多次 LEFT JOIN 实现逐级筛选。以四步漏斗为例:

WITH step1 AS (
  SELECT DISTINCT user_id, event_time AS t1
  FROM events 
  WHERE event_name = 'view_product' 
    AND event_time >= NOW() - INTERVAL '7 days'
),
step2 AS (
  SELECT DISTINCT user_id, event_time AS t2
  FROM events 
  WHERE event_name = 'add_to_cart'
    AND event_time >= NOW() - INTERVAL '7 days'
),
step3 AS (
  SELECT DISTINCT user_id, event_time AS t3
  FROM events 
  WHERE event_name = 'submit_order'
    AND event_time >= NOW() - INTERVAL '7 days'
),
step4 AS (
  SELECT DISTINCT user_id, event_time AS t4
  FROM events 
  WHERE event_name = 'pay_success'
    AND event_time >= NOW() - INTERVAL '7 days'
)
SELECT 
  COUNT(DISTINCT s1.user_id) AS step1_cnt,
  COUNT(DISTINCT s2.user_id) AS step2_cnt,
  COUNT(DISTINCT s3.user_id) AS step3_cnt,
  COUNT(DISTINCT s4.user_id) AS step4_cnt,
  ROUND(COUNT(DISTINCT s2.user_id) * 100.0 / NULLIF(COUNT(DISTINCT s1.user_id), 0), 2) AS rate_1to2,
  ROUND(COUNT(DISTINCT s3.user_id) * 100.0 / NULLIF(COUNT(DISTINCT s2.user_id), 0), 2) AS rate_2to3,
  ROUND(COUNT(DISTINCT s4.user_id) * 100.0 / NULLIF(COUNT(DISTINCT s3.user_id), 0), 2) AS rate_3to4
FROM step1 s1
LEFT JOIN step2 s2 ON s1.user_id = s2.user_id AND s2.t2 > s1.t1 AND s2.t2 <= s1.t1 + INTERVAL '24 hours'
LEFT JOIN step3 s3 ON s2.user_id = s3.user_id AND s3.t3 > s2.t2 AND s3.t3 <= s2.t2 + INTERVAL '24 hours'
LEFT JOIN step4 s4 ON s3.user_id = s4.user_id AND s4.t4 > s3.t3 AND s4.t4 <= s3.t3 + INTERVAL '24 hours';

注意:JOIN 条件中加入时间先后和窗口限制,避免倒序或跨天误算。

PHP5 和 MySQL 圣经
PHP5 和 MySQL 圣经

本书是全面讲述PHP与MySQL的经典之作,书中不但全面介绍了两种技术的核心特性,还讲解了如何高效地结合这两种技术构建健壮的数据驱动的应用程序。本书涵盖了两种技术新版本中出现的最新特性,书中大量实际的示例和深入的分析均来自于作者在这方面多年的专业经验,可用于解决开发者在实际中所面临的各种挑战。

下载

用条件聚合 + 窗口函数简化写法(推荐)

更简洁高效的方式是先标记每个用户是否完成各步骤,再聚合。适合步骤较多或需灵活调整场景:

WITH user_steps AS (
  SELECT 
    user_id,
    MAX(CASE WHEN event_name = 'view_product' THEN 1 ELSE 0 END) AS has_view,
    MAX(CASE WHEN event_name = 'add_to_cart' THEN 1 ELSE 0 END) AS has_cart,
    MAX(CASE WHEN event_name = 'submit_order' THEN 1 ELSE 0 END) AS has_order,
    MAX(CASE WHEN event_name = 'pay_success' THEN 1 ELSE 0 END) AS has_pay,
    -- 可选:记录最早发生时间用于排序验证
    MIN(CASE WHEN event_name = 'view_product' THEN event_time END) AS t_view,
    MIN(CASE WHEN event_name = 'add_to_cart' THEN event_time END) AS t_cart,
    MIN(CASE WHEN event_name = 'submit_order' THEN event_time END) AS t_order,
    MIN(CASE WHEN event_name = 'pay_success' THEN event_time END) AS t_pay
  FROM events 
  WHERE event_name IN ('view_product','add_to_cart','submit_order','pay_success')
    AND event_time >= NOW() - INTERVAL '7 days'
  GROUP BY user_id
  HAVING 
    MIN(CASE WHEN event_name = 'view_product' THEN event_time END) IS NOT NULL
),
valid_paths AS (
  SELECT *
  FROM user_steps
  WHERE 
    (t_cart IS NULL OR t_cart > t_view) AND
    (t_order IS NULL OR t_order > t_cart) AND
    (t_pay IS NULL OR t_pay > t_order)
)
SELECT 
  COUNT(*) AS step1_cnt,
  SUM(has_cart) AS step2_cnt,
  SUM(has_order) AS step3_cnt,
  SUM(has_pay) AS step4_cnt,
  ROUND(SUM(has_cart) * 100.0 / NULLIF(COUNT(*), 0), 2) AS rate_1to2,
  ROUND(SUM(has_order) * 100.0 / NULLIF(SUM(has_cart), 0), 2) AS rate_2to3,
  ROUND(SUM(has_pay) * 100.0 / NULLIF(SUM(has_order), 0), 2) AS rate_3to4
FROM valid_paths;

这种方式逻辑清晰、易于扩展步骤,也方便后续加维度(如按渠道、设备分组)。

注意事项与常见陷阱

漏斗分析容易出错的地方:

  • 未去重用户:直接 COUNT(*) 会把一个用户多次行为重复计算,必须用 COUNT(DISTINCT user_id)
  • 忽略时间顺序:用户先支付再下单显然不合理,JOIN 或 HAVING 中必须校验时间先后
  • 会话归属混乱:没做 session 切分时,用户隔天行为可能被误连;建议先按设备+时间切分会话再跑漏斗
  • 数据延迟与空值:支付事件可能比下单晚几秒甚至几分钟入库,WHERE 条件的时间范围要留余量

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

681

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

320

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

347

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1095

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

357

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

676

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

575

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

416

2024.04.29

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

72

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Laravel 5.8 中文文档手册
Laravel 5.8 中文文档手册

共74课时 | 85.2万人学习

SESSION实现登录与验证
SESSION实现登录与验证

共10课时 | 9.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号