0

0

Sails.js如何处理XML文件上传和流式处理

煙雲

煙雲

发布时间:2026-01-27 10:42:09

|

899人浏览过

|

来源于php中文网

原创

XML文件上传需绕过body-parser拦截,用skipper的.stream()获取原始流,配合sax-js事件驱动解析,避免内存溢出;同时注意Content-Type、文件名编码及错误处理。

sails.js如何处理xml文件上传和流式处理

XML文件上传时body-parser会拦截并报错

Sails.js默认使用body-parser中间件,它会自动解析application/jsonapplication/x-www-form-urlencodedtext/*类型的请求体,但遇到application/xmltext/xml时——尤其是文件上传场景下——常抛出UnsupportedMediaTypeError或直接截断原始流。这不是Sails的bug,而是body-parser主动拒绝未声明支持的类型。

解决方法是禁用对XML内容类型的自动解析:

  • config/http.js中,将bodyParser配置为跳过application/xmltext/xml
  • 或者更稳妥地:完全移除bodyParser中间件,改由控制器手动处理原始req
  • 注意:禁用bodyParser后,所有req.body将为空对象,JSON/form数据也需自行解析(除非你只处理XML上传)

用skipper直接接收XML文件流

Sails内置的文件上传中间件skipper(通过req.file())默认只接受multipart/form-data,且会把整个文件读入内存再触发回调。这对大XML文件很危险——容易OOM。必须启用流式处理。

关键点:

  • req.file('xml')返回的是SkipperDiskSkipperS3流,不是普通fs.ReadStream,但它实现了Readable接口
  • 务必设置maxBytes防止恶意超大上传
  • 不要调用.upload(),改用.stream()获取原始流
module.exports = {
  uploadXml: async function (req, res) {
    try {
      const file = req.file('xml');
      // 直接获取流,不落地磁盘
      const stream = await file.stream();

      // 接入XML流式解析器,如 sax-js 或 xml2js.Parser({ stream: true })
      const parser = new require('sax').Parser(true);
      stream.pipe(parser);

      parser.on('opentag', (node) => {
        console.log('tag:', node.name);
      });

      parser.on('error', (err) => {
        return res.serverError(err.message);
      });

      parser.on('end', () => {
        return res.ok({ status: 'parsed' });
      });
    } catch (err) {
      res.badRequest(err.message);
    }
  }
};

sax-js比xml2js更适合流式XML处理

xml2jsparseString是全量解析,即使设stream: true也只是“伪流式”——它仍需收集全部文本再触发回调。sax-js才是真正的事件驱动流解析器,内存占用恒定,适合GB级XML。

互连在线双语商务版
互连在线双语商务版

全自动化、全智能的在线方式管理、维护、更新的网站管理系统主要功能如下:一、系统管理:管理员管理,可以新增管理员及修改管理员密码;数据库备份,为保证您的数据安全本系统采用了数据库备份功能;上传文件管理,管理你增加产品时上传的图片及其他文件。二、企业信息:可设置修改企业的各类信息及介绍。 三、产品管理:产品类别新增修改管理,产品添加修改以及产品的审核。四、订单管理:查看订单的详细信息及订单处理。 五、

下载

注意事项:

  • sax不校验XML格式完整性,遇到损坏标签会触发error事件而非静默忽略
  • 若需XPath查询或DOM操作,不能依赖sax,得先用流写入临时文件再用libxmljs等解析
  • 确保Content-Typeapplication/xmltext/xml,否则skipper可能无法识别字段

上传路径中的filename乱码与编码问题

浏览器上传XML时,Content-Disposition里的filename可能含中文,而skipper默认按latin1解码,导致乱码为?????.xml。这不是XML内容问题,是HTTP头解析缺陷。

修复方式:

  • 前端encodeURIComponent对文件名编码,并在Content-Disposition中显式声明filename*=UTF-8''...
  • 后端req.file()前,用require('iconv-lite').decode()手动重解码req.headers['content-disposition']
  • 更简单方案:忽略原始文件名,用uuid()生成唯一ID,从XML内容里提取业务标识(如

流式处理XML的核心就两条:绕过body-parser拿到原始流,用sax边读边解析。其余都是围绕这两点打补丁——比如乱码、超大、错误恢复。别试图把XML当字符串load进内存再parse,那是最慢也最容易崩的方式。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
什么是中间件
什么是中间件

中间件是一种软件组件,充当不兼容组件之间的桥梁,提供额外服务,例如集成异构系统、提供常用服务、提高应用程序性能,以及简化应用程序开发。想了解更多中间件的相关内容,可以阅读本专题下面的文章。

178

2024.05.11

Golang 中间件开发与微服务架构
Golang 中间件开发与微服务架构

本专题系统讲解 Golang 在微服务架构中的中间件开发,包括日志处理、限流与熔断、认证与授权、服务监控、API 网关设计等常见中间件功能的实现。通过实战项目,帮助开发者理解如何使用 Go 编写高效、可扩展的中间件组件,并在微服务环境中进行灵活部署与管理。

214

2025.12.18

json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

418

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

535

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

311

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

76

2025.09.10

require的用法
require的用法

require的用法有引入模块、导入类或方法、执行特定任务。想了解更多require的相关内容,可以阅读本专题下面的文章。

466

2023.11.27

pdf怎么转换成xml格式
pdf怎么转换成xml格式

将 pdf 转换为 xml 的方法:1. 使用在线转换器;2. 使用桌面软件(如 adobe acrobat、itext);3. 使用命令行工具(如 pdftoxml)。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1897

2024.04.01

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

0

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.5万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号