
谷歌近日正式发布 Magika 1.0,这是其基于人工智能的文件类型识别系统的首个稳定版本。此次更新标志着该项目在性能优化与系统安全性上的重要进展——其核心引擎现已完全用 Rust 语言重写。自去年向公众开源以来,Magika 迅速在开发者社区中流行,目前每月下载量已突破百万次。
新版本对整体架构进行了深度重构,在提升运行效率的同时增强了内存安全防护能力。据谷歌介绍,Magika 1.0可在单核 CPU 上实现每秒数百个文件的快速识别,若使用多核处理器,则处理速度可扩展至每秒数千个文件。该系统采用 ONNX Runtime 执行模型推理,并结合 Tokio 异步运行时框架,保障了高并发场景下的稳定表现。
在支持的文件格式方面,Magika 1.0现已能够识别超过200种文件类型,较初代版本翻了一倍。新增支持涵盖数据科学和机器学习领域的 Jupyter Notebook、Numpy 和 PyTorch 文件,也包括现代开发中广泛使用的 Swift、Kotlin 和 TypeScript 等编程语言文件。同时,DevOps 工具链中的配置文件、SQLite 数据库以及 AutoCAD 图形文件等也已被纳入检测范围。
本版本还显著提升了对高度相似文件类型的区分精度,例如能更准确地区分 C 与 C++ 源码、JavaScript 与 TypeScript 脚本。在技术攻坚过程中,谷歌面临训练数据体量庞大及部分文件样本稀少的难题。为此,团队构建了专用数据集平台 SedPack,并借助自家生成式 AI 模型 Gemini 生成高质量合成数据,有效增强了模型的泛化性和鲁棒性。
此外,Magika 1.0同步更新了 Python 和 TypeScript 的客户端模块,大幅简化了集成流程。开发者可通过简单命令在主流操作系统上完成安装与部署。谷歌也诚邀更多开源贡献者加入项目,共同推动这一工具的功能拓展与持续优化。
以上就是谷歌发布 AI 文件检测工具 Magika 1.0,全面采用 Rust 语言的详细内容,更多请关注php中文网其它相关文章!
谷歌浏览器Google Chrome是一款可让您更快速、轻松且安全地使用网络的浏览器。Google Chrome的设计超级简洁,使用起来得心应手。这里提供了谷歌浏览器纯净安装包,有需要的小伙伴快来保存下载体验吧!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号