数智化转型网人工智能资讯每日人工智能资讯｜大视觉模型目标检测基准：GPT-4o Vision精度仅0.02，专业模型仍具压倒性优势

每日人工智能资讯｜大视觉模型目标检测基准：GPT-4o Vision精度仅0.02，专业模型仍具压倒性优势

作者: 本网小编发布: 2026年5月9日

AIMultiple于2026年5月7日发布大视觉模型（LVM）目标检测专项基准测试，对比评测GPT-4o Vision、YOLOv8n与DETR三款模型在1000张图像上的目标检测表现，揭示通用视觉模型与专用视觉模型的能力鸿沟。

评测结果（检测精度mAP@0.5）：
• DETR：0.55（最优）
• YOLOv8n：0.20
• GPT-4o Vision：0.02（远低于专用模型）

推理延迟（毫秒/图）：
• YOLOv8n：365ms（最快）
• DETR：3145ms
• GPT-4o Vision：5150ms（最慢）

趋势判断：
GPT-4o等通用大视觉模型在目标检测任务上的精度（0.02 mAP）与其在语言和通用推理上的表现形成鲜明反差——垂直领域的专用模型（如YOLOv8n）凭借极致优化仍保持压倒性优势。企业部署视觉AI不应迷信”大一统”模型，需根据精度/速度/成本三角进行理性选型。

若您对人工智能感兴趣，可添加数智化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商，可联系数智化转型网小助手思思（17757154048，微信同号）

思思微信二维码

若您为人工智能服务商，可添加数智化转型网小助手Nora，加入人工智能行业交流群。

Nora微信二维码

若您为人工智能创业者，可添加数智化转型网社群主理人Carina，加入人工智能创业交流群。

Carina微信二维码

声明：本文来自数智化转型网，版权归作者所有。文章内容仅代表作者独立观点，不代表数智化转型网立场，转载目的在于传递更多信息。如有侵权，请联系我们。

底部图片

本文由数智化转型网（www.szhzxw.cn）转载，编辑/翻译：数智化转型网（Professionalism Achieves Leadership 专业造就领导者）迅龙

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时，请及时通知本站，予以删除。https://www.szhzxw.cn/117627.html

1赞

标签:人工智能资讯