0

0

PostgreSQL:精确计算平均值,利用WHERE子句高效过滤数据

碧海醫心

碧海醫心

发布时间:2025-11-11 19:17:13

|

509人浏览过

|

来源于php中文网

原创

PostgreSQL:精确计算平均值,利用WHERE子句高效过滤数据

本教程详细讲解如何在postgresql中计算平均值时,高效地排除特定范围的数据。文章通过分析一个常见的错误示例,解释了为何不应在客户端代码中进行初步过滤后再次尝试用sql查询一个不存在的“临时表”,并提供了使用sql的`where`子句直接在数据库层面进行数据过滤和聚合的正确且高效的方法。

在数据分析和报表生成中,计算平均值是一项基本操作。然而,很多时候我们需要排除数据集中某些异常值或不符合特定条件的数据点,以确保平均值的准确性和代表性。本文将以PostgreSQL为例,详细阐述如何高效且正确地实现这一目标。

数据准备

首先,我们假设有一个名为 measurements 的表,用于存储各项测量数据。其结构如下:

CREATE TABLE measurements (
  id SERIAL PRIMARY KEY,
  measurement INTEGER NOT NULL
);

该表包含一个自增ID和 measurement 列,用于存储整数类型的测量值。

问题描述

我们的目标是计算 measurements 表中 measurement 列的平均值。但需要注意的是,我们希望排除那些值小于0或大于1000的测量数据,只对在 [0, 1000] 范围内的有效数据进行平均值计算。

错误方法分析

在实际开发中,开发者有时会尝试一种看似合理但实际上存在问题的处理方式。以下是一个常见的错误示例,它尝试在客户端(例如Deno环境下的JavaScript)中分两步完成:

import postgres from "https://deno.land/x/postgresjs/mod.js";

const sql = postgres({}); // 假定 sql 实例已正确初始化

const averageMeasurement = async() => {
    // 第一步:尝试从数据库中获取符合条件的数据
    const excMeasurements = await sql`SELECT * FROM measurements WHERE measurement <= 1000 AND measurement > 0`;

    // 第二步:尝试对第一步获取到的结果再次执行 SQL 聚合
    // 错误点:excMeasurements 是一个 JavaScript 变量,不是数据库中的表或视图
    const rows =  await sql`SELECT AVG(measurement) AS average FROM excMeasurements`;
    return rows[0].average;
}

export { averageMeasurement };

错误原因分析:

上述代码中,excMeasurements 是一个在Deno(JavaScript)环境中接收到的数据数组或对象,它代表了从数据库查询到的结果集。然而,它仅仅是客户端内存中的一个变量。当第二条SQL语句 SELECT AVG(measurement) AS average FROM excMeasurements 被执行时,数据库服务器会尝试在自身的数据库架构中查找名为 excMeasurements 的关系(即表或视图)。由于数据库中并不存在这样一个关系,它会报告一个错误,例如“relation "excMeasurements" does not exist”(关系“excMeasurements”不存在),从而导致客户端接收到“Internal Server Error”或类似的数据库操作失败信息。

这种方法不仅错误,而且效率低下,因为它首先将所有符合初步过滤条件的数据从数据库传输到客户端,然后再尝试对这些数据在数据库中进行聚合,这在逻辑上是矛盾的。

Lateral App
Lateral App

整理归类论文

下载

正确且高效的解决方案

解决这个问题的关键在于,将数据过滤和聚合操作全部委托给数据库服务器来完成。PostgreSQL提供了强大的SQL语句,允许我们通过 WHERE 子句在聚合函数执行之前对数据进行筛选。

核心SQL语句:

SELECT AVG(measurement) AS average
FROM measurements
WHERE measurement >= 0 AND measurement <= 1000;

工作原理:

  1. FROM measurements:指定从 measurements 表中查询数据。
  2. WHERE measurement >= 0 AND measurement
  3. SELECT AVG(measurement) AS average:对经过 WHERE 子句过滤后的数据行,计算 measurement 列的平均值,并将结果命名为 average。

这种方法将过滤和聚合逻辑完全封装在一条SQL查询中,由数据库服务器高效地执行,避免了不必要的数据传输和客户端逻辑的混淆。

在Deno/Postgres.js中集成

将上述正确的SQL查询集成到Deno(或其他Node.js环境)的Postgres.js客户端代码中非常直接:

import postgres from "https://deno.land/x/postgresjs/mod.js";

const sql = postgres({}); // 确保 sql 实例已正确初始化,例如:postgres('postgres://user:password@host:port/database');

const averageMeasurement = async() => {
    const rows = await sql`
        SELECT AVG(measurement) AS average
        FROM measurements
        WHERE measurement >= 0 AND measurement <= 1000;
    `;
    // 检查是否有结果,以防表为空或没有符合条件的数据
    if (rows.length > 0 && rows[0].average !== null) {
        return rows[0].average;
    } else {
        // 如果没有符合条件的数据,AVG() 会返回 NULL,可以根据业务需求返回 0 或抛出错误
        return null; // 或者 0,或者抛出 new Error("No valid measurements found for average calculation.");
    }
}

export { averageMeasurement };

注意事项与最佳实践

  1. 数据库端处理的优势: 始终优先在数据库服务器端完成数据过滤和聚合操作。这可以最大限度地减少网络传输的数据量,并充分利用数据库管理系统(DBMS)的查询优化器和索引,从而显著提高查询效率和响应速度。
  2. SQL的语义清晰: WHERE 子句是SQL标准中用于条件过滤的明确机制,其逻辑清晰、易于理解和维护。
  3. 处理空结果集: 当 WHERE 子句过滤后没有数据行,或者所有符合条件的行的 measurement 值都为 NULL 时,AVG() 函数将返回 NULL。在客户端代码中,需要妥善处理这种情况,例如返回 null、0,或者抛出特定的异常,以符合业务逻辑。
  4. 其他过滤场景: WHERE 子句的功能远不止数值范围过滤。它还可以用于各种复杂的条件,例如:
    • measurement IS NOT NULL:排除空值。
    • measurement IN (10, 20, 30):只包含特定值。
    • measurement LIKE 'prefix%':基于模式匹配过滤字符串(如果 measurement 是字符串类型)。
    • 结合 AND、OR、NOT 构建更复杂的逻辑。
  5. 避免混合逻辑: 避免将数据库查询逻辑与客户端语言的逻辑混淆。数据库查询应尽可能地独立和完整,客户端代码主要负责构建查询、发送请求和处理结果。

总结

在PostgreSQL中计算平均值并排除特定范围的数据,最正确和高效的方法是直接在 SELECT AVG() 查询中使用 WHERE 子句进行条件过滤。这种方法利用了数据库的强大能力,确保了数据处理的效率和准确性,同时也使得代码逻辑更加清晰和易于维护。理解客户端代码与数据库查询之间的边界,是编写高性能、健壮应用程序的关键。

相关专题

更多
js获取数组长度的方法
js获取数组长度的方法

在js中,可以利用array对象的length属性来获取数组长度,该属性可设置或返回数组中元素的数目,只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值,也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容,供大家免费下载使用。

540

2023.06.20

js刷新当前页面
js刷新当前页面

js刷新当前页面的方法:1、reload方法,该方法强迫浏览器刷新当前页面,语法为“location.reload([bForceGet]) ”;2、replace方法,该方法通过指定URL替换当前缓存在历史里(客户端)的项目,因此当使用replace方法之后,不能通过“前进”和“后退”来访问已经被替换的URL,语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

372

2023.07.04

js四舍五入
js四舍五入

js四舍五入的方法:1、tofixed方法,可把 Number 四舍五入为指定小数位数的数字;2、round() 方法,可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

727

2023.07.04

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

470

2023.09.01

JavaScript转义字符
JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号,可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容,供大家免费下载体验。

391

2023.09.04

js生成随机数的方法
js生成随机数的方法

js生成随机数的方法有:1、使用random函数生成0-1之间的随机数;2、使用random函数和特定范围来生成随机整数;3、使用random函数和round函数生成0-99之间的随机整数;4、使用random函数和其他函数生成更复杂的随机数;5、使用random函数和其他函数生成范围内的随机小数;6、使用random函数和其他函数生成范围内的随机整数或小数。

989

2023.09.04

如何启用JavaScript
如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍:1、内联脚本是将JavaScript代码直接嵌入到HTML标签中;2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中;3、外部脚本是将JavaScript代码放置在一个独立的文件;4、外部脚本是将JavaScript代码放置在一个独立的文件。

653

2023.09.12

Js中Symbol类详解
Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型,用于表示独一无二的值。Symbol的特点:1、独一无二,每个Symbol值都是唯一的,不会与其他任何值相等;2、不可变性,Symbol值一旦创建,就不能修改或者重新赋值;3、隐藏性,Symbol值不会被隐式转换为其他类型;4、无法枚举,Symbol值作为对象的属性名时,默认是不可枚举的。

541

2023.09.20

桌面文件位置介绍
桌面文件位置介绍

本专题整合了桌面文件相关教程,阅读专题下面的文章了解更多内容。

0

2025.12.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 3.1万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 1.8万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 2.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号