12月13日,在第二届CCF中国数据大会上,蚁数宣布其关键数据代理技术Agentar SQL开源,涵盖所有论文、代码、模型和用户指南。这项智能代理技术使非专业人士能够通过日常语言进行业务数据查询和分析,为企业数字化提供了更准确且可用的智能数据分析基础。
Ant Digital 的首个开源版本是一个实时文本到结构化查询语言(Text-to-SQL)框架,为开发者提供了开箱即用的数据查询解决方案,提升了文本到数据库查询交互的效率。2026年,蚁数字将逐步开源数据库理解与挖掘、行业知识挖掘及实时多回合交互技术框架,涵盖从意图理解、业务理解到数据理解的整个数据能力链。数字化转型网www.szhzxw.cn
记者了解到,在一家大型城市商业银行的试点作中,蚂蚁数字Agentar SQL中多个工具的平均查询准确率超过92%,是传统查询解决方案的三倍多。
今年9月25日,Ant数字数据分析智能代理Agentar-Scale-SQL在该技术支持下,成为全球最具权威的自然语言到结构化查询语言(NL2SQL)评估基准BIRD-SQL,超越了谷歌等多家国内外制造商。目前,智能代理在准确率排名和执行效率排名中均位居首位,连续超过两个月。
BIRD-SQL需要AI模型将自然语言查询转换为SQL,并在真实复杂的大规模生产数据库中稳定执行。其数据集涵盖了37个真实行业场景,包括金融、电力和医疗,总容量为33GB和超过10,000个高复杂度查询任务,使其成为全球最具挑战性的NL2SQL测试。数字化转型网www.szhzxw.cn
研究机构预测,全球商业智能市场规模将在2025年达到474.8亿。预计中国商业智能与分析软件市场规模将在2025年达到12亿。预计到2028年,中国商业智能软件市场规模将达到17.9亿美元,预计五年复合年增长率(CAGR)为12.7%,成为未来构建企业智能技术的重要且必要的投资领域。
目前,中国企业使用商业智能和分析产品的方式存在显著差异,大多数企业专注于数据可视化和简单的分析需求,如报告、仪表盘、仪表盘和数据屏幕。然而,在真实生产环境中提升可用性同时保持准确性,被认为是NL2SQL大规模部署行业面临的常见挑战。数字化转型网www.szhzxw.cn
蚁人数字人工智能技术负责人张鹏在会议上指出,NL2SQL在实际实现中面临四大严峻挑战:理解歧义和多义的人类语音、注入大量行业专属知识、解析复杂的数据库结构和关系,以及生成准确且无错误的复杂SQL语句。这些挑战意味着简单的模型“包装”远远不足以满足企业级应用的可靠性和准确性要求。
例如,金融行业的专业人士常常需要结合复杂的业务规则和多种条件,以有效分析产品数据。在商业管理中,非专业数据分析师的口语问题要求底层产品正确理解行业术语和用户意图,然后准确匹配数据库字段以产生真实准确的结果。数字化转型网www.szhzxw.cn
张鹏强调,BIRD-SQL主要评估生成复杂SQL(在线扩展)的能力,但要真正实现工业级NL2SQL或数据代理技术,必须构建更完整的能力栈。除了在线扩展,它还需要:
1. 离线扩展:对数据库的深入理解和知识结构化。
2. 人际互动:智能体识别自身不确定性,主动澄清用户意图,实现透明协作和错误纠正。
3. 自我进化:通过“内存”优化、创建和重用工具(如UDFs)及其他“无调优”技术,使智能体能够从错误中学习,持续改进,减少对大量标记数据和专家调优的依赖。
Ant Digital 计划逐步开源这些更全面的功能模块,如用于理解数据库的 Agentar Profiling-SQL,以及用于无调优演进的 Agentar TuningFree-SQL。最初的在线扩展框架Agentar-Scale-SQL已在arXiv、GitHub、ModelScope和Hugging Face等平台上发布,迅速吸引了开发者的关注。
若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然
