每日人工智能资讯|打破多模型切换壁垒！谷歌将“电脑操作”原生塞进 Gemini 3.5 Flash-数智化转型网

谷歌 DeepMind 团队宣布了一项重大技术突破，将原生的计算机使用能力直接集成到了 Gemini 3.5 Flash 模型中。这意味着开发者现在只需通过单一模型，就能构建出在浏览器、手机和电脑桌面上自主看屏并执行操作的 AI 智能体。数智化转型网www.szhzxw.cn

此前这项能力仅作为一个独立模型提供，开发者需要在不同模型之间进行复杂的切换与上下文传递。如今实现原生集成后，AI 在执行跨平台长任务时无需再手动传递信息，极大地简化了开发流程。

一、告别上下文丢失，直击 Agent 可靠性痛点

谷歌团队认为，AI 智能体的核心瓶颈并不在于单个工具的极限，而在于多个工具切换时容易造成的上下文信息丢失。通过将搜索、地图和计算机操作统一在一个模型架构下，上下文得以连续流动，大幅降低了复杂任务中途失败的概率。数智化转型网www.szhzxw.cn

这种“多工具合一”的设计，就如同直接建造一座内部连通的综合建筑，省去了多栋独立建筑之间漫长且容易出错的通信过程。这种架构级别的调整，有望为代理式任务的可靠性和响应延迟带来实质性的改善。

这项原生能力将主要应用于三大核心场景，包括需要数小时甚至数天持续操作的自动化任务、自动验证用户界面一致性的持续性软件测试，以及跨应用的知识性工作。这些场景都高度依赖于多任务之间的上下文连续性，能有效替代人类进行重复高能耗的操作。数智化转型网www.szhzxw.cn

在安全设计上，谷歌采用了包含针对性对抗训练、敏感操作企业安全护栏以及间接提示注入检测在内的多层防御策略。面对开放且不可控的真实计算机环境，这些机制将共同为企业用户构建起相对完整的安全边界。数智化转型网www.szhzxw.cn

若您对人工智能感兴趣或为人工智能创始人，可添加数智化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商，可联系数智化转型网小助手思思（17757154048，微信同号）

若您为人工智能服务商，可添加数智化转型网小助手Jasper，加入人工智能行业交流群。

声明：本文来自数智化转型网，版权归作者所有。文章内容仅代表作者独立观点，不代表数智化转型网立场，转载目的在于传递更多信息。如有侵权，请联系我们。

本文由数智化转型网（www.szhzxw.cn）转载，编辑/翻译：数智化转型网（Professionalism Achieves Leadership 专业造就领导者）白龙