微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > 科技周边 > 人工智能 > 正文

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

WBOY

发布： 2023-11-17 23:39:01

转载

1161人浏览过

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

11 月 16 日消息，谷歌公司近日发布新闻稿，介绍了小型人工智能模型 mirasol，可以回答有关视频的问题并创造新的记录。

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

AI 模型目前很难处理不同的数据流，如果要让 AI 理解视频，需要整合视频、音频和文本等不同模态的信息，这大大增加了难度。

谷歌和谷歌 Deepmind 的研究人员提出了新的方法，将多模态理解扩展到长视频领域。

借助Mirasol AI模型，该团队努力解决两个关键挑战：

需要以高频采样同步视频和音频，但要异步处理标题和视频描述。
视频和音频会生成大量数据，这会让模型的容量紧张。

在Mirasol中，谷歌采用了合路器和自回归转换器模型

该模型组件将处理时间同步的视频和音频信号，然后将视频拆分成独立的片段

模力视频

模力视频

模力视频 - AIGC视频制作平台 | AI剪辑 | 云剪辑 | 海量模板

模力视频

51

模力视频

转换器处理每个片段，并学习每个片段之间的联系，然后使用另一个转换器处理上下文文本，这两个组件交换有关其各自输入的信息。

一个新的转换模块名为Combiner，能够从每个片段中提取通用表示，并通过降维来压缩数据。每个片段包含4到64帧，该模型目前拥有30亿个参数，能够处理128到512帧的视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

在测试中，Mirasol3B 在视频问题分析方面达到了新的基准，体积明显更小，并且可以处理更长的视频。通过使用带有内存的组合器变体，该团队能够进一步降低所需的计算能力18%

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频

本站在此附上 Mirasol 的官方新闻稿，感兴趣的用户可以深入阅读。

以上就是谷歌推出Mirasol：30亿参数，将多模态理解扩展至长视频的详细内容，更多请关注php中文网其它相关文章！

相关标签：

谷歌人工智能异步人工智能

大家都在看：

谷歌Veo 3.1升级！增强图像视频生成，还新增音频功能 Veo 3.1— 谷歌推出的AI视频生成模型 SongBloom— 腾讯AI Lab推出的全长度歌曲生成模型 Androidify— 谷歌开源的如何构建AI Android应用项目 Gemini 2.5 Computer Use— 谷歌推出的计算机使用模型

谷歌浏览器

谷歌浏览器

谷歌浏览器Google Chrome是一款可让您更快速、轻松且安全地使用网络的浏览器。Google Chrome的设计超级简洁，使用起来得心应手。这里提供了谷歌浏览器纯净安装包，有需要的小伙伴快来保存下载体验吧！

来源：51CTO.COM网

上一篇：腾讯云“AI超级底座”专场将亮相WOT大会，技术创新引领AI基础设施新篇章下一篇：谷歌人工智能在快速、准确的天气预报方面击败了超级计算机

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

夸克浏览器怎么用AI搜索_夸克AI搜索正确提问方式教学

2025-10-25 23:12:01
夸克浏览器AI搜索最新版教学_探索夸克AI搜索的隐藏功能

2025-10-24 20:48:02
玩转夸克浏览器的AI搜索模式_夸克AI搜索新手入门操作指南

2025-10-20 09:50:01
夸克浏览器一键启用AI搜索_带你体验夸克AI搜索的强大之处

2025-10-19 18:42:01
夸克浏览器如何调用AI搜索_夸克AI搜索的快捷指令大全

2025-10-19 11:02:02
夸克浏览器AI搜索入口在哪_一文读懂夸克AI搜索如何激活

2025-10-19 09:25:01
夸克浏览器AI搜索深度体验_夸克AI搜索与其他AI的对比

2025-10-18 22:34:01
手机版夸克浏览器AI搜索设置_移动端夸克AI搜索使用全攻略

2025-10-17 23:58:01
夸克浏览器AI搜索功能详解_几个实用的夸克AI搜索技巧分享

2025-10-17 17:20:02
提升效率的夸克浏览器AI搜索_夸克AI搜索高效使用秘籍

2025-10-17 16:12:05

最新问题

OpenAI生图入口 OpenAI生成PPT免费入口 OpenAI生图功能可通过Sora平台（sora.chatgpt.com）使用，支持文本生成视频与图像；PPT生成可借助ChatGPT（chatgpt.com）输入主题自动生成大纲并导出为PPT格式。

2025-11-09 08:34:02

121

文心一言官网入口打开即用 AI文心一言免费体验入口文心一言免费体验入口为https://yiyan.baidu.com/welcome，用户可直接访问官网使用，无需注册，支持文本生成、多轮对话、历史记录查看，适用于文案创作、学习研究与头脑风暴等场景。

2025-11-09 08:17:02

248

腾讯朱雀大模型工具朱雀AI检测官网入口链接腾讯朱雀大模型工具官网入口为https://matrix.tencent.com/ai-detect/，提供文本与图像智能检测服务，支持多格式内容上传与多维度分析。

2025-11-09 08:01:02

939

LEANTS乐蚁J5如何设置闹钟提醒_LEANTS乐蚁J5闹钟添加、编辑与响铃设置教程可通过LEANTS乐蚁J5手环设置多个自定义闹钟，使用“乐蚁健康”APP添加、编辑或删除闹钟，并调节震动提醒模式，确保按时收到提示。

2025-11-09 05:09:15

328

秘塔AI编辑图片入口在哪里 AI图像编辑秘塔入口一键直达秘塔AI编辑图片入口位于官网首页“图像工坊”快捷按钮，点击即可直达https://www.mita-ai.com/image-editor，支持拖拽上传、智能去背景、局部重绘与滤镜风格化等功能，无需注册即可使用。

2025-11-09 04:21:22

351

即梦4.0怎样使用色彩分离功能_即梦4.0色彩分层与分离效果使用方法即梦4.0可在iPadPro上通过滤镜模块实现色彩分离，将图像颜色按色相或亮度拆分为3-8个可编辑图层，支持手动调节色相、饱和度与容差，并可导出为分层PNG用于后续设计。

2025-11-09 04:15:18

195

夸克A眼镜如何连接车载系统_夸克A眼镜与汽车系统互联使用方法要实现夸克AI眼镜与汽车互联，需通过蓝牙连接、手机中转或启用近眼导航Agent。首先可将眼镜作为蓝牙音频设备接收导航语音；其次通过已连接CarPlay/CarLife+的手机同步导航信息至眼镜；最后可激活夸克-高德联合导航Agent，实现近眼显示关键路况提示，提升驾驶安全性。

2025-11-09 03:29:32

977

Cursor 2.0携自研模型Composer登场，编码工具新变革谁能胜出？ Cursor2.0重磅发布，推出两项关键升级：全新自研编码模型Composer，以及支持多智能体并行协作的革命性界面。这一版本标志着Cursor正式从“AI增强编辑器”迈向“AI原生开发平台”的关键转折。此前，尽管Cursor广受开发者青睐，常被称为“AI时代的VSCode”，但其核心依赖Claude、GPT等第三方大模型，这种架构虽为其起步提供了便利，也逐渐成为性能与体验优化的瓶颈。如今，随着Composer的诞生，Cursor终于迈出了摆脱外部依赖、构建自主技术壁垒的重要一步。![图片1]C

2025-11-08 23:38:20

453

OpenAI PPT生成入口在哪里 OpenAI AI PPT一键直达入口 OpenAI暂未推出独立PPT生成工具，目前可通过ChatGPT平台实现，入口为https://openai.com/blog/chatgpt。

2025-11-08 23:12:03

918

抖音爆款AI视频免费制作手机AI短视频生成入口抖音爆款AI视频免费制作入口在即梦AI官网，用户可通过其H5页面或应用输入文字一键生成带场景、角色的短视频，并支持编辑、配音及分享至抖音等平台。

2025-11-08 23:12:02

1011

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部