数智化转型网szhzxw.cn 数字化转型知识 重建AI数据战略的8个建议

重建AI数据战略的8个建议

任何想要打造领先 AI 战略的组织,首先必须落地一套成功的数据战略。这是 IBM 副总裁兼首席数据官埃德・洛夫利的观点。。数字化转型网www.szhzxw.cn

他表示:“在规划人工智能的规模化布局时,数据是根基所在。”

但他同时提到,能做到数据架构与 AI 目标相匹配的组织少之又少。与之相反的是,很多企业的数据呈现出孤岛化的状态,缺乏统一数据标准的管控 —— 这是企业长期以来的数据战略所导致的结果,最终让 IT 环境变成了围绕单个应用来支撑关键决策,而非为企业级的人工智能部署提供支持。

IBM 在 2025 年发布的研究报告《人工智能雄心高涨,但企业数据做好准备了吗?》,展现了当下企业在数据处理方面的困境。该研究对全球 1700 名首席数据官(CDO)进行调研后发现,仅 26% 的受访者认为自身的数据体系,有能力为新的 AI 收入来源提供支撑。

洛夫利指出,企业真正需要的是一套集成化的企业级数据架构,无论数据来自哪里,都能遵循统一的标准、治理规范和元数据要求。

意识到组织需要升级数据战略的并非只有洛夫利一人。

亚当・赖特是 IDC 全球 DataSphere 与 Global StorageSphere 研究项目的研究经理,同时也是 2025 年《生成式人工智能时代的内容创作》报告的合著者,他表示:“人工智能不仅改变了数据的使用方式,还改变了数据的价值创造逻辑与价值落地的场景,因此绝大多数组织都需要对自身的数据战略进行现代化升级。”

他谈到:“传统的数据战略,主要服务于报告输出、商业智能分析与流程自动化,但人工智能的落地,需要更具动态性、更精细化且实时的数据管道,以此来支撑迭代式、模型驱动的工作流。这意味着企业要从静态的数据治理,转向持续性的数据质量监控;要强化元数据管理与数据血缘追踪;同时制定的存储政策,也要适配人工智能将瞬时数据、缓存数据与留存数据相结合的特点。人工智能时代要求企业摒弃‘收集并存储所有数据’的固有思维,转向更具目的性、以价值为导向的数据战略,在成本、风险,以及想要达成的具体 AI 成果之间找到平衡。”。数字化转型网www.szhzxw.cn

一、高成熟度的数据基础

当下大部分组织都还离这个目标有不小的距离。

赖特说:“很多组织还在为获取‘合适’的数据而困扰,这里的‘合适’,可能是指足够的数据量、合格的数据质量,或是支撑 AI 用例所必须的上下文元数据。”“在 IDC 的研究以及行业交流中,数据准备度始终是企业实现 AI 价值的主要阻碍之一,其影响程度往往超过计算成本或是模型选择的问题。大部分企业仍面临着系统碎片化、治理标准不统一,以及对实际数据的情况和可信度缺乏了解的问题。”

洛夫利表示,IBM 也曾遇到过不少类似的挑战,但在过去三年里,IBM 一直着力解决这些问题,让自身的数据与 AI 体系走向成熟。

IBM 在人工智能时代的数据战略,对以往的方法做出了多项调整,以此搭建出洛夫利所说的集成化企业数据架构。比如,IBM 保留了数据所有者的概念,但 “会帮助这些所有者理解,数据是 IBM 的资产,如果我们能以可控、安全的方式实现数据的民主化,就能让业务运转得更好、更高效”。

在此基础上,IBM 从原本多个团队各自管理孤立数据的状态,转变为由统一的团队,采用统一标准与通用架构来管理数据。企业的管理者还整合了 300TB 的数据,根据公司想要达成的成果,以及支撑这些成果的工作流,来筛选所需的数据。。数字化转型网www.szhzxw.cn

洛夫利说:“我们的每一步都有明确的目标”,他还补充道,如今 IBM 的数据平台,已经覆盖了公司约 80% 的工作流。“当前企业提升生产力的关键途径之一,就是搭建集成化的企业数据架构。正是因为我们在数据领域的投入,才得以在公司内部快速推进人工智能的部署。”

二、打造更优数据战略的8条建议

想要搭建高成熟度的数据基础,提升数据的使用能力,组织需要一套适配人工智能时代的数据战略 —— 这套战略要能够保障数据质量、打破数据孤岛,并且让数据能力与企业优先推进的 AI 用例相匹配。

专家给出了以下建议:

1、重新定义数据所有权

赖特解释道:“以往将数据所有权单纯归为 IT 部门的模式已经不再适用,因为业务单元、产品团队与人工智能平台,都在持续地生成和处理数据。”“理想状态下,应该由首席数据官(CDO)这样的高级数据领导者来承担明确的责任,但没有设置 CDO 的组织,必须确保数据治理的职责,在 IT、安全与业务部门之间得到清晰的划分。”。数字化转型网www.szhzxw.cn

他还补充,“设立一个制定政策的单一权威节点,同时采用联邦制的执行模式十分关键,这样业务单元既可以保有一定的自主权,又不会脱离统一的管理。”

圣托马斯大学软件工程与数据科学系主任、应用人工智能中心主任曼吉特・雷吉建议,组织可以把数据所有者重新定义为数据管理者,他们并不 “拥有” 数据,而是基于统一标准,对数据的定义与质量负责。而数据的治理、安全与互通性,则由中央数据管理部门负责。。数字化转型网www.szhzxw.cn

2、打破数据孤岛

赖特说:“CIO 需要围绕共同的 AI 与数据目标,协调各个业务单元,因为只有当企业内部的工作流、流程与数据源实现打通时,生成式 AI 才能真正创造价值。”

“这需要搭建跨职能的治理体系,统一分类标准与管理政策,同时制定激励机制,鼓励团队共享数据而非独占数据,” 他补充道,“技术层面可以通过统一平台、元数据层与通用安全框架来提供支持,但真正的突破,需要高管层与业务相关方的协同引领。”

3、布局适配 AI 时代的数据技术

赖特表示,这类技术包括现代数据湖、数据湖仓、向量数据库,以及可扩展的对象存储,这些技术 “都能在完善的治理体系下,处理大规模的多模态数据”。

组织还需要流程编排与数据管道工具,实现数据的采集、清洗、转换与流转的自动化,从而保障 AI 工作流能够稳定地端到端运行。元数据引擎与治理层也至关重要,它们可以帮助模型理解数据上下文、追踪数据血缘,并且安全、可靠地使用结构化与非结构化数据。

雷吉建议搭建 “模块化、可管控且具备演进能力” 的数据平台层。“你的架构需要把数据当成可复用的产品,而非只服务于单一流程的资源,同时还要满足批量处理与实时处理的双重需求。”

雷吉也认可数据湖与数据湖仓的价值,他认为它们 “正在成为人工智能应用的核心载体,因为它们可以同时处理结构化与非结构化数据”。。数字化转型网www.szhzxw.cn

此外,Thoughtworks 首席人工智能与数据官沙扬・莫汉蒂建议,CIO 可以打造可组合的企业架构,采用模块化技术与灵活的结构,让人机可以跨多层访问数据并开展协作。专家还建议 CIO 投资能够满足新型数据生命周期需求的技术。“生成式人工智能从根本上重塑了数据的生命周期,形成了瞬时数据、缓存数据与持久存储数据的动态组合。” 赖特说,大部分生成式 AI 的输出存续时间很短,可能只有几秒、几分钟或是几小时,这就需要 DRAM、SSD 这类高性能的基础设施,来支撑快速迭代、缓存与易失性的工作流。“但与此同时,也有一部分生成式 AI 的产出具备长期价值,比如最终文件、获批的媒体资产、合成训练数据集,以及合规相关的内容,这类数据的长期存储,依然高度依赖高性价比、大容量的硬盘存储,” 他补充道,“随着生成式人工智能的普及,组织需要一套覆盖全生命周期的数据战略,从支撑瞬时数据的超高速内存,到用于持久存档的硬盘系统,因为数据存储的成本与需求特征都已经发生了改变。”

4、为数据架构加入自动化与智能能力

莫汉蒂认为,企业数据状况不理想的原因,在于 “数据生产者与数据消费者之间的脱节”,数据被 “堆积在所谓的数据仓库中”,再通过分析层来挖掘数据价值。他指出,这种方法需要投入大量的人力与专业知识才能实现。。数字化转型网www.szhzxw.cn

他建议企业建立数据产品思维,“拉近数据生产者与消费者之间的距离”,同时在企业架构中加入自动化与智能能力,让 AI 可以在需要时,自主识别并获取合适的数据。莫汉蒂表示,CIO 可以通过模型上下文协议(MCP)来封装数据,实现协议级别的数据访问,他同时提到,想要实现这样的访问,组织需要在数据目录与工具中录入相关信息,保障数据的可发现性。

5、确保结构化与非结构化数据都做好 AI 适配准备

赖特说:“当结构化数据格式统一、治理完善,并且附带准确的元数据时,就做好了 AI 适配的准备,模型可以轻松地理解与使用这些数据。”“组织应该优先建立完善的数据质量管控机制、主数据管理体系,同时明确数据所有权,以此保障结构化数据的可靠性、互通性,并且与特定的 AI 应用场景相契合。”

专家强调,企业需要用同样的标准来管理非结构化数据,确保非结构化数据得到准确的标记、分类,并且补充足够的元数据,让 AI 系统可以高效地理解与检索这些数据。“你需要把非结构化数据当作核心的数据资产来看待,” 雷吉说,“很多极具价值的 AI 应用场景,都依托于非结构化数据,比如客户服务的音频通话、消息记录与文档,但对很多组织来说,非结构化数据的价值还没有得到充分挖掘。”雷吉建议将非结构化数据存储在可搜索的向量数据库中。。数字化转型网www.szhzxw.cn

7、引入外部数据源与合成数据

赖特说:“当企业现有的数据存在不完整、有偏见、数据量不足,或是与目标 AI 用例不匹配的问题时,完全可以考虑引入外部数据或是合成数据,” 他指出,“当真实数据涉及敏感信息、收集成本过高,或是受到隐私、监管、运营等方面的限制时,合成数据的优势就会格外明显。”

分阶段搭建高成熟度的数据基础Salesforce 企业 IT 战略高级副总裁希巴尼・阿胡贾表示,不必等到数据状态完美再启动行动。“有些组织认为必须把所有数据都梳理到位才能开始推进,但同时他们也面临着启动相关工作的压力,” 她说。和大多数企业项目的成熟路径一样,CIO 及其管理团队可以 —— 也应该 —— 采取渐进式的方法,来搭建 AI 时代的数据项目。阿胡贾建议,将数据项目与业务成果绑定,先搭建支撑某一个 AI 驱动成果的数据战略与架构,验证完善之后,再推进下一个目标。“这是一种逆向思维:从想要达成的结果倒推行动方案,” 阿胡贾说。“先把相关的内容落地应用,确保有完善的管控机制,观察运行效果,调整优化到可以规模化复制的状态,再推进下一步的工作。”。数字化转型网www.szhzxw.cn

8、搭建跨职能的数据团队

赖特说:“数据的管理需要一套跨职能的生态系统来支撑,涉及 IT、数据治理、安全部门,以及实际使用数据来驱动决策的业务单元。”“人工智能时代的数据战略,在这些团队共同参与管理时能发挥出最佳效果:IT 团队负责基础设施的支撑,治理团队保障数据的可信度与质量,业务团队则明确数据的应用场景与价值。”

若您对人工智能感兴趣,可添加数字化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数字化转型网小助手思思(17757154048,微信同号)

若您为人工智能服务商,可添加数字化转型网小助手Nora,加入人工智能行业交流群。

若您为人工智能创业者,可添加数字化转型网社群主理人Carina,加入人工智能创业交流群。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于网络;编辑/翻译:数字化转型网(Professionalism Achieves Leadership 专业造就领导者)默然

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。http://www.szhzxw.cn/104191.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部