JDA语音活动检测：onUserSpeaking()事件行为解析与语音接收方案

霞舞

发布时间：2025-11-23 15:38:20

934人浏览过

来源于php中文网

原创

JDA语音活动检测：onUserSpeaking()事件行为解析与语音接收方案

本文深入探讨了jda库中`connectionlistener`的`onuserspeaking()`事件在检测用户语音活动时出现的行为变更。由于discord平台更新，该事件现在仅在用户开始说话时触发一次，不再指示结束。为实现可靠的语音开始/结束检测，教程推荐采用语音接收（audio receive）机制，通过监听实际音频数据流来判断用户是否正在讲话，这与discord客户端的实现方式一致，并提供了概念性的代码示例与注意事项。

onUserSpeaking()事件的现状与局限

JDA (Java Discord API) 为开发者提供了与Discord平台交互的强大工具，其中包括通过ConnectionListener接口监听语音连接状态和用户语音活动。开发者通常期望onUserSpeaking()方法能够准确地指示用户语音的开始和结束。然而，根据最新的行为观察，该方法现在仅在用户首次开始说话时触发一次，并将speaking参数设置为true。即使用户停止说话，该方法也不会再次触发以指示结束。

一个值得注意的现象是，如果机器人被移动到不同的语音频道，当用户在该新频道中再次开始说话时，onUserSpeaking()事件会再次触发一次。

以下是典型的ConnectionListener实现示例及其控制台输出，用以说明这一行为：

package functionality;

import net.dv8tion.jda.api.audio.hooks.ConnectionListener;
import net.dv8tion.jda.api.audio.hooks.ConnectionStatus;
import net.dv8tion.jda.api.entities.User;
import net.dv8tion.jda.api.hooks.ListenerAdapter;

public class SpeechRecognition extends ListenerAdapter implements ConnectionListener {

    @Override
    public void onPing(long ping) {
        System.out.println("PING: " + ping);
    }

    @Override
    public void onStatusChange(ConnectionStatus status) {
        System.out.println("STATUS: " + status);
    }

    // 此方法现在只在用户开始说话时触发一次，不会再触发 speaking = false
    @Override
    public void onUserSpeaking(User user, boolean speaking) {
        // 旧版本可能预期会在这里处理 speaking = false
    }

    @Override
    public void onUserSpeaking(User user, boolean speaking, boolean soundshare) {
        System.out.println("SPEAKING: " + speaking + " | " + user.getName() + " | " + soundshare);
    }
}

当用户在连接的语音频道中开始说话时，控制台输出可能如下：

The bot is now connected to the voice channel.
STATUS: CONNECTING_AWAITING_WEBSOCKET_CONNECT
STATUS: CONNECTING_AWAITING_AUTHENTICATION
STATUS: CONNECTING_ATTEMPTING_UDP_DISCOVERY
STATUS: CONNECTING_AWAITING_READY
PING: 203
STATUS: CONNECTED
SPEAKING: true | Losokos | false   // 用户开始说话时触发
PING: 103
PING: 138
PING: 132
PING: 108
PING: 121

从输出可以看出，SPEAKING: true只出现了一次，而没有对应的SPEAKING: false来指示用户停止说话。这表明onUserSpeaking()事件已不再适合用于精确检测语音活动的完整周期。

行为变更的根本原因

这种行为上的变化并非JDA库的缺陷，而是由于Discord平台自身对语音事件分发机制的调整。Discord现在发送的语音更新事件只是一次性的，不再包含明确的“停止说话”事件。这意味着依赖onUserSpeaking()事件来精确判断用户语音活动的开始和结束已不再可靠。

可靠的解决方案：利用语音接收（Audio Receive）

为了准确地检测用户何时开始和停止说话，推荐的方法是利用JDA的语音接收（Audio Receive）功能。这种方法通过直接监听和处理从语音频道接收到的音频数据流来判断用户的语音活动，这与Discord客户端内部检测用户说话状态的机制是一致的。

AI发型设计

虚拟发型试穿工具和发型模拟器

下载

实现原理

当用户在语音频道中说话时，机器人会接收到该用户的音频数据包。通过持续监测这些数据包的到来与中断，可以推断出用户的说话状态。如果持续接收到某个用户的音频数据，则认为该用户正在说话；如果一段时间内没有再收到该用户的音频数据，则认为该用户已停止说话。

实现步骤（概念性指导）

实现AudioReceiveHandler接口： JDA提供了net.dv8tion.jda.api.audio.AudioReceiveHandler接口。你需要创建一个实现此接口的类。

注册AudioReceiveHandler： 将你的实现类注册到AudioManager中。例如：

import net.dv8tion.jda.api.managers.AudioManager;
// ...
// 获取当前Guild的AudioManager
AudioManager audioManager = guild.getAudioManager();
// 设置语音接收处理器
audioManager.setReceivingHandler(new MyAudioReceiveHandler());

处理音频数据： 在AudioReceiveHandler的实现中，你需要重写以下方法：
- canReceiveUser()：此方法用于确定是否应该接收来自特定用户的音频。返回true通常表示接收所有用户的音频。
- handleUserAudio(UserAudio userAudio)：这是核心方法，当接收到来自用户的音频数据时会被调用。UserAudio对象包含了用户、音频数据（PCM格式）以及其他相关信息。
- handleEncodedAudio(OpusPacket opusPacket)：如果你想处理原始的Opus编码音频包，可以使用此方法。
判断说话状态： 在handleUserAudio()方法中，只要此方法被频繁调用，就意味着该用户正在说话。你需要自行实现一个计时器或状态机来跟踪每个用户的说话状态。例如，记录每个用户最后一次发送音频的时间戳，并定期检查是否有用户在设定的静默阈值内没有发送任何音频。

示例代码片段（核心逻辑提示）

以下是一个简化的AudioReceiveHandler实现，演示了如何通过监测音频流来判断用户说话状态：

import net.dv8tion.jda.api.JDA; // 假设JDA实例可以通过某种方式获取
import net.dv8tion.jda.api.audio.AudioReceiveHandler;
import net.dv8tion.jda.api.audio.UserAudio;
import net.dv8tion.jda.api.entities.User;

import java.util.Map;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.Executors;
import java.util.concurrent.ScheduledExecutorService;
import java.util.concurrent.TimeUnit;

public class MyAudioReceiveHandler implements AudioReceiveHandler {

    private final JDA jdaInstance; // 传入JDA实例以便获取User对象
    private final Map lastAudioTime = new ConcurrentHashMap<>();
    private final Map speakingStatus = new ConcurrentHashMap<>();
    private final ScheduledExecutorService scheduler = Executors.newSingleThreadScheduledExecutor();
    private static final long SILENCE_THRESHOLD_MS = 500; // 500毫秒无音频视为停止说话

    public MyAudioReceiveHandler(JDA jda) {
        this.jdaInstance = jda;
        // 定期检查用户是否停止说话
        scheduler.scheduleAtFixedRate(this::checkSpeakingStatus, 0, 100, TimeUnit.MILLISECONDS);
    }

    @Override
    public boolean canReceiveUser() {
        return true; // 允许接收所有用户的音频
    }

    @Override
    public void handleUserAudio(UserAudio userAudio) {
        long userId = userAudio

如何在 Java 中向数组末尾添加新元素（正确实现与替代方案）

如何在 Java 中向数组末尾添加新元素（正确实践与替代方案）

Java 中向数组末尾添加新元素的正确方法（含替代方案与最佳实践）

如何在 Java 中向数组末尾添加新元素

HashMap 无法正确识别数组键的原因及解决方案

相关专题

java

Java是一个通用术语，用于表示Java软件及其组件，包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容，供大家免费下载使用。

831

2023.06.15

java正则表达式语法

java正则表达式语法是一种模式匹配工具，它非常有用，可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题，供大家免费下载体验。

737

2023.07.05

java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言，有着较为简洁和易读的语法，本专题为大家提供java自学难吗相关的文章，大家可以免费体验。

733

2023.07.31

java配置jdk环境变量

Java是一种广泛使用的高级编程语言，用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码，需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中，保留两位小数是指在进行数值计算或输出时，限制小数部分只有两位有效数字，并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型

java基本数据类型有：1、byte；2、short；3、int；4、long；5、float；6、double；7、char；8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容，供大家免费下载体验。

446

2023.08.02

java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容，供大家免费下载体验。

430

2023.08.02

java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来，随着Java语言在软件开发领域的广泛应用，越来越多的人对Java编程感兴趣，并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章，欢迎大家前来学习阅读和下载。

16925

2023.08.03

Java 项目构建与依赖管理（Maven / Gradle）

本专题系统讲解 Java 项目构建与依赖管理的完整体系，重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例，帮助学习者掌握从零搭建、维护到发布 Java 工程的标准化流程，提升在实际团队开发中的工程能力与协作效率。

2026.01.12

热门下载

网站特效

网站源码

网站素材

前端模板