数智化转型网szhzxw.cn 人工智能资讯 苹果 FastVLM 上线:5分钟体验85倍速视觉 AI,数据永不出设备

苹果 FastVLM 上线:5分钟体验85倍速视觉 AI,数据永不出设备

AIbase报道 – Apple 几个月前发布的 FastVLM 视觉语言模型现已向公众开放,用户可在搭载 Apple Silicon 芯片的 Mac 上直接体验这项革命性技术。

FastVLM 是一种能够提供近乎即时高分辨率图像处理的视觉语言模型,基于 Apple 专为 Apple Silicon 设计的开放 ML 框架 MLX 构建。相比同类模型,FastVLM 在视频字幕处理速度上提升了85倍,同时体积缩小了3倍以上。

多平台可用,浏览器直接体验

Apple 在完善项目后,FastVLM 不仅在 GitHub 上开源,还登陆了 Hugging Face 平台。用户现在可以直接在浏览器中加载轻量级的 FastVLM-0.5B 版本,无需复杂安装过程即可体验其强大功能。

根据实测,在16GB M2Pro MacBook Pro 上,模型加载需要几分钟时间。加载完成后,模型能够实时准确描述用户外貌、背景环境、面部表情以及视野中的各种物体。

智能交互功能丰富

该模型支持多种预设提示,用户可以要求模型:

  • 用一句话描述所见场景
  • 识别衣物颜色
  • 读取可见文本内容
  • 分析情感和动作
  • 识别手中物体

高级用户还可结合虚拟摄像头应用,观察模型如何即时详细描述复杂的多场景视频内容。

本地化运行的隐私优势

FastVLM 的一大亮点是完全在浏览器本地运行,数据永不离开设备,甚至支持离线使用。这种设计为可穿戴设备和辅助技术应用提供了理想解决方案,轻便性和低延迟特性为更广泛的应用场景奠定了基础。

目前浏览器演示使用的是5亿参数的轻量级版本,FastVLM 系列还包含15亿和70亿参数的更强大变体,能够提供更优异的性能表现,尽管这些大型模型可能无法直接在浏览器中运行。

声明:本文来自AI新闻资讯,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于AI新闻资讯;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)萍水

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/91688.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部