最近,著名的开源浏览器自动化项目BrowserUse正式发布了其首个自开发的大型语言模型——BU-30B-A3B-Preview。该模型立即引起广泛关注,被誉为“网络代理领域的新标杆”,以卓越的成本效益和实时速度彻底突破了AI浏览器运营的壁垒。数字化转型网www.szhzxw.cn
模型架构:MoE设计,实现“强大大脑,轻量化身体”
BU-30B-A3B-Preview采用专家混合架构,总参数规模为30B(300亿),但仅在实际推理时激活3B(30亿)参数。这使得模型能够保持顶级智能,同时显著减少资源消耗,并在单一消费级GPU上流畅运行。
该模型基于阿里云通仪Qwen3-VL-30B-A3B-Instruct深度调优,专为浏览器自动化场景优化,支持多模态输入(视觉+文本),上下文长度可达32K令牌,轻松处理复杂的长网页内容。数字化转型网www.szhzxw.cn
核心能力:出色的DOM理解和视觉推理
BU-30B-A3B-Preview在浏览器作任务中表现出色,提供全面的网页交互功能,包括精准元素定位、点击、滚动和表单填充。其卓越的DOM(文档对象模型)理解和视觉推理能力使AI代理能够像人类一样“理解”页面布局和截图,实现高度可靠的自动化执行。
该官员强调,该模型特别适合构建Web代理应用场景,如自动化测试、数据收集和RPA流程,并在内部基准测试中达到行业领先水平。
性能亮点:速度与成本双重优势
官方对比数据显示,BU-30B-A3B-Preview在任务完成速度和成本效益方面远超主流商用型号:
– 平均每个作步骤仅需1.2秒,显著领先整体任务完成时间。
– 卓越的成本效益:每投入一美元计算资源,大约可以可靠完成200个浏览器任务,这比一些竞争模型高出数十倍。
由于其模型体积相对较小(适合单GPU部署),开发者可以轻松本地下载和测试,且无需高昂的云计算成本。数字化转型网www.szhzxw.cn
开源意义:加速网络代理生态系统的发展
BU-30B-A3B-Preview 完全开源,模型权重已上传到 Hugging Face 平台,允许任何开发者免费获取并集成到 BrowserUse 开源库中。这标志着浏览器自动化领域进入“高效开源时代”,预计将推动更多创新应用的发展。
AIbase 评论:BU-30B-A3B-Preview 的发布完美解决了传统大型模型在浏览器任务中“昂贵且缓慢”的痛点。对于需要大规模网络自动化的企业和开发者来说,这无疑是一个极具成本效益的选择。未来,随着社区进一步优化,该模型预计将成为Web Agent领域的标准配置。感兴趣的读者可以立即前往Hugging Face下载并体验。、
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
