讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 新闻 > IT新闻 > 正文

谷歌发布 Gemini 2.5 Computer Use 模型

花韻仙語

发布： 2025-10-09 18:24:02

原创

230人浏览过

谷歌近日推出了一款名为“gemini 2.5 computer use”的新型模型，该模型基于gemini 2.5 pro打造，具备强大的“视觉理解与推理能力”，能够解析用户指令并自主执行相应任务。其核心亮点在于实现ai智能体与图形用户界面之间的自动化交互，进一步拓展了谷歌在ai操作生态领域的布局。

谷歌发布 Gemini 2.5 Computer Use 模型

据悉，该模型融合了先进的视觉识别与逻辑推演技术，可模拟人类在浏览器中的多种操作行为，包括点击、输入、滚动等共计13种动作。即使面对缺乏API接口的网页环境或涉及多页面跳转的复杂场景，它也能顺利完成任务，例如自动填写表单、抓取并筛选商品信息、汇总在线笔记内容等。通过采用迭代式工作流程，模型会结合屏幕截图和历史操作反馈不断优化执行策略，在如Online-Mind2Web等权威基准测试中展现出卓越性能与低延迟表现。

谷歌发布 Gemini 2.5 Computer Use 模型

GPT-MINUS1

GPT-MINUS1

通过在文本中随机地用同义词替换单词来愚弄GPT

GPT-MINUS1

153

GPT-MINUS1

相较于其他同类产品，Gemini 2.5 Computer Use更专注于浏览器内的自动化操作，目前暂未扩展至桌面系统级别的控制能力。同时，为保障安全性，模型内建了多重防护机制，并提供开发者可控工具，有效防范诸如绕过验证码或执行高风险操作等潜在滥用问题。

目前，Gemini 2.5 Computer Use模型正处于预览阶段，开发者可通过Google AI Studio以及Vertex AI平台中的Gemini API接入并使用相关功能。

以上就是谷歌发布 Gemini 2.5 Computer Use 模型的详细内容，更多请关注php中文网其它相关文章！

相关标签：

go 浏览器谷歌工具 ai google gemini 接口自动化

大家都在看：

OpenAI 推出 ChatGPT 群聊功能，开启多人协作新体验中国学生比美国多2小时课、无课外活动将培育更多AI人才？ Docker 29.0.0 发布特别的更新 | zorm v1.8.0 发布被OpenAI抢尽锋头？微软更新Copilot AI浏览器功能关注度不如以往

谷歌浏览器

谷歌浏览器

谷歌浏览器Google Chrome是一款可让您更快速、轻松且安全地使用网络的浏览器。Google Chrome的设计超级简洁，使用起来得心应手。这里提供了谷歌浏览器纯净安装包，有需要的小伙伴快来保存下载体验吧！

来源：php中文网

上一篇：开源 3D 建模与动画软件 Blender 发布 5.0 Beta 测试版下一篇：通义千问技术负责人林俊旸牵头组建内部具身智能团队

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

鸠摩搜索怎么使用

2025-12-15 12:29:02
《三角洲行动》加强打击鼠标宏：最高十年封号

2025-12-15 12:33:07
广汽高域飞行汽车试飞检测基地在韶关运营，配备垂直起降点与滑行跑道

2025-12-15 12:38:02
MaxKey 4.1.10 已经发布，单点登录认证系统

2025-12-15 12:39:13
黑皮大雷美人！《噬血代码2》角色预告片：柯莉・阿斯图里亚斯

2025-12-15 12:39:20
优化Web交互：利用CSS实现无闪烁的鼠标悬停效果

2025-12-15 12:44:23
D加密如此遭人恨？P5R成功破解引外网热议

2025-12-15 12:57:12
万代类魂《噬血代码2》新预告！黑皮贵妇「荷莉‧阿斯图里亚斯」

2025-12-15 13:07:02
Flex布局中防止文本换行并实现横线填充剩余空间

2025-12-15 13:12:09
JavaScript事件处理：高效获取具有相同类名按钮的Value值

2025-12-15 13:47:01

最新问题

RuleGo v0.35.0 发布：国产轻量级、全场景、新一代组件编排规则引擎 RuleGo是一款基于Go语言打造的轻量级、高效率、可嵌入、支持组件化编排的新一代规则引擎。它助力开发者快速构建松耦合、高灵活性的系统，轻松应对复杂多变的业务逻辑。RuleGo内置丰富的可复用组件，涵盖数据聚合、条件过滤、消息分发、格式转换、上下文丰富化以及各类动作执行等能力，并原生支持与多种协议（如HTTP、MQTT、gRPC、WebSocket等）及外部系统无缝对接与集成，广泛适用于自动化营销、物联网平台、企业应用集成等场景。其架构在内存占用与运行性能方面经过深度优化，资源消耗极低——既可

2025-12-17 20:34:23

175

新型 AI 模型“读心”能力惊人：不仅看穿动作，更能预判意图人工智能在解析人类行为方面实现了关键性突破。得克萨斯农工大学（TexasA&MUniversity）的研究团队近期推出了一款名为“OmniPredict”的创新人工智能系统，该系统展现出前所未有的意图预判能力——它不仅可识别视觉中的人体动作，更能融合多源环境信息，实时推演人类即将采取的行为意图。这项成果标志着自动驾驶技术正由“感知响应”迈向“认知预判”的全新阶段。传统自动驾驶系统大多依赖对行人位置与运动轨迹的即时检测，而OmniPredict则深度融合了多模态大语言模型（MLLM）架构，赋

2025-12-17 20:34:03

566

AI 数据平台 Databricks 启动 L 轮融资，估值达 1340 亿美元据《华尔街日报》独家披露，专注于数据分析与人工智能软件的科技企业Databricks近期完成L轮融资，融资金额逾40亿美元，公司最新估值攀升至约1340亿美元，相较今年夏季增长34%。截至10月底，其年度经常性收入（ARR）已达48亿美元。Databricks明确表示，将在明年面向全球大规模扩招，新增岗位数量达数千个，其中重点聚焦AI领域顶尖科研人才，并持续深化与OpenAI、Anthropic等前沿AI公司的战略合作，加速推动企业级AI智能体的落地应用。本轮融资由InsightPartners

2025-12-17 19:07:11

275

SamWaf v1.3.18 开源、轻量级、私有化部署网站防火墙本次更新重点围绕社区近期提出的新增需求与已知问题展开迭代，涵盖功能增强、体验优化及稳定性修复自本版本起全面引入gormigrate进行数据库迁移管理，为后续架构演进与版本兼容性打下基础首次集成系统级防火墙联动能力，支持直接阻断指定IP对服务器的全链路访问（不限于Web层）升级明细如下：新增：CC防护模块支持按条件动态启用规则，提升防御灵活性。感谢(@blue991989)新增：提供一键式配置备份与还原功能，含完整配置文件快照。感谢(@SONGjiemo)新增：内置查询分

2025-12-17 19:02:02

118

腾讯大模型团队架构调整，新成立 AI Infra 部、AI Data 部、数据计算平台部据36氪《智能涌现》独家消息，腾讯近日完成新一轮组织架构升级，正式组建AIInfra部、AIData部及数据计算平台部三大新部门。据悉，12月17日下午发布的内部通知显示，VincesYao将担任“CEO/总裁办公室”首席AI科学家，直接向腾讯总裁刘炽平汇报；同时，他还将兼任AIInfra部与大语言模型部负责人，向技术工程事业群总裁卢山汇报。VincesYao即此前数月加入腾讯的姚顺雨，其本科就读于清华大学“姚班”，后于普林斯顿大学获得计算机科学博士学位，曾就职于OpenAI，是该公司首批智能体

2025-12-17 18:38:23

486

京东外卖在全国范围上线“自提”功能 12月17日消息，今日京东外卖正式在全国范围推出“自提”服务，用户可享受“线上下单、到店取货、即提即走”的便捷体验。平台同步启动“京东外卖请客·自提一分抢”活动：大牌品牌轮番请客，整点限量1分钱抢购，选择自提方式还可额外立减1元。据京东发布的2025年第二季度及中期业绩公告，公司当季营收达3567亿元，创下近三年来最快收入增速；京东外卖日均订单量已突破2500万单，服务网络覆盖全国350座城市。值得关注的是，京东集团董事局主席刘强东曾公开指出，京东布局外卖业务的根本出发点在于深耕生鲜供应链能力—

2025-12-17 18:17:02

449

何小鹏：当前没有 AI 泡沫，人形机器人将来会是巨头的竞争感谢网友软媒新友2497150、啊俊、HH_KK的线索提供！12月17日讯，今日，小鹏汽车董事长何小鹏在其社交平台发布动态，围绕AI是否存在泡沫、物理AI的演进路径、美国新兴创业生态与机器人发展态势，以及通用人工智能（AGI）的现实进展等焦点议题，分享了个人观察与思考。何小鹏指出，人形机器人赛道未来将主要由科技巨头主导竞争；而面向特定场景的专用机器人，则会涌现大量垂直领域创新企业，并孕育极为丰富的商业成功机会。在他看来，当前AI领域并不存在系统性泡沫，AI所承载的产业空间与社会价值仍处于

2025-12-17 17:44:08

236

智元提出 WholeBodyVLA，面向真实世界的人形机器人全身 VLA 框架智元AGIBOT宣布，由香港大学、智元AGIBOT、复旦大学及上海创智学院组成的跨机构研究团队共同推出WholeBodyVLA——一种专为真实场景下双足人形机器人设计的全身级Vision–Language–Action统一框架。https://opendrivelab.com/WholeBodyVLA/https://github.com/OpenDriveLab/WholebodyVLA据悉，该成果依托智元灵犀X2平台开展研究，首次将视觉-语言-动作（VLA）范式系统性拓展至人形机器人全身运

2025-12-17 17:25:03

661

北极气温再创新高，自 1900 年有记录以来的最高值感谢网友Djoker_Huang提供的线索！12月17日消息，新华社今日援引美国国家海洋和大气管理局（NOAA）于16日发布的《北极年度气候报告》指出，在2024年10月至2025年9月这一年度统计周期中，北极地表平均气温达到自1900年系统观测以来的历史最高水平。报告进一步指出，过去十年是北极有气象记录以来最热的十年。自2006年起，该区域年均升温速率已突破全球平均水平的两倍以上。此外，据TechSpot今年8月报道，尽管全球整体气温持续攀升，但过去二十年间北极海冰的消融速率却呈现出明显趋缓态

2025-12-17 17:15:08

737

小米推出网页版 AI 聊天服务：Xiaomi MiMO Studio 今日上午，小米公司在2025年小米人车家全生态合作伙伴大会上正式推出并全面开源全新MoE架构大模型——MiMo-V2-Flash，同时上线网页端AI聊天平台：XiaomiMiMOStudio。用户可通过该平台直接体验开源版MiMO-V2-Flash模型。XiaomiMiMOStudio具备深度检索与实时联网搜索能力，支持多场景智能交互，包括自然语言问答、内容创作与润色、逻辑推理与分析、跨语言翻译、创意灵感激发、代码生成与调试等核心功能。使用需登录小米账号，当前API接口处于限

2025-12-17 17:03:07

1339

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Go 教程

25831次学习
收藏
Go语言实战之 GraphQL

7663次学习
收藏
Go语言实战-Gin+WebSocket构建IM即时聊天Demo

3982次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部