扣子AI敏感词过滤需手动启用内置开关、导入自定义词库、配置分级响应、开启语义识别及绑定告警通道。操作路径依次为:控制台→智能体设置→内容安全→启用过滤、管理词库、设定策略、开启高级选项、配置告警规则。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您在使用扣子AI生成内容时发现存在违规风险,或平台因文本触发审核机制而限流、拦截,则可能是由于敏感词未被有效识别与阻断。以下是针对扣子AI设置敏感词过滤的具体操作路径与多种实现方式:
一、启用内置敏感词过滤开关
扣子AI默认搭载基础敏感词识别模块,但该功能需手动激活,否则不参与内容生成前的实时扫描。开启后,系统将依据预置规则对政治、色情、暴恐、违禁广告等高频违规类目进行匹配拦截。
1、登录扣子AI管理控制台,进入“智能体设置”页面。
2、在左侧导航栏中点击“内容安全”选项卡。
3、找到“敏感词实时过滤”功能区,将右侧开关拖动至开启状态。
4、确认弹窗提示“已启用系统级词库”,并勾选“生成前自动校验”复选框。
5、点击“保存配置”,此时所有新生成的文本均会经过该层校验。
二、导入自定义敏感词库
内置词库无法覆盖行业特有表达或新兴变体词,通过手动添加关键词可显著提升过滤精准度,尤其适用于电商话术、医疗宣称、财经分析等高监管场景。
1、在“内容安全”页内,点击“自定义词库管理”按钮。
2、选择“新增单个词”或“批量导入”,支持粘贴文本或上传CSV文件。
3、输入需屏蔽的词语,例如“ guaranteed results”、“最快速见效”、“国家一级资质”等易触发广告法或平台限流的表述。
4、为每个词设定匹配模式:“精确匹配”、“包含关键词”或“正则表达式匹配”。
5、点击“提交并生效”,系统将在下一次生成请求中同步应用该词表。
三、配置分级响应动作
并非所有敏感词都需直接拦截,部分低风险词汇适合标记提示而非阻断流程。通过分级策略,可在合规前提下保留内容灵活性与运营效率。
1、在“响应策略”子菜单中,选择“启用分级处理”。
2、将已入库敏感词划分为三档:禁止发布(红色)、人工复核(黄色)、仅标注不拦截(蓝色)。
3、为每档设定对应行为:红色词触发时中断生成并返回错误提示;黄色词生成后附加审核标签,并推送至指定企业微信/邮箱;蓝色词仅在编辑器中标黄显示。
4、保存策略后,在测试窗口输入含不同级别词的句子,验证响应是否符合预期。
四、启用语义级敏感识别模式
传统关键词匹配易被谐音、拆字、符号隔断等方式绕过,扣子AI提供基于语义理解的增强型识别能力,可识别“v1p”“zhu fu”“电#脑”等变形表达,适用于强对抗性内容环境。
1、返回“内容安全”主界面,展开“高级过滤选项”。
2、勾选“启用语义混淆识别”与“拼音/形近字映射检测”。
3、系统将自动加载轻量级NLP模型,在文本预处理阶段进行同音替换还原与结构歧义分析。
4、在词库中添加示例变形词如“shen fen zheng”、“GDP增长”(当上下文涉及地方政绩表述时)。
5、启用后,生成日志中将新增“语义风险分”字段,便于回溯判断依据。
五、绑定敏感词触发告警通道
当高频或高危词被连续触发时,需及时通知责任人介入排查,避免批量内容违规。告警机制可联动外部系统,形成闭环响应链路。
1、进入“告警与通知”设置页,点击“新增告警规则”。
2、设定触发条件:单日累计命中次数≥5次,或同一敏感词连续触发3次以上。
3、选择通知方式:企业微信机器人、飞书群消息、邮件(支持SMTP配置)。
4、填写接收人列表,并设定告警模板,模板中可嵌入原始触发文本片段与匹配词及所属级别。
5、启用规则后,首次命中即向指定渠道发送结构化告警信息。










