数智化转型网szhzxw.cn 数字化转型网专题栏目 ECM:非结构化数据治理解决方案

ECM:非结构化数据治理解决方案

数字化转型网人工智能研习社关注人工智能从技术到落地的全方面,包含机器学习算法、深度学习架构、自然语言处理(NLP)技术、计算机视觉技术、AI+医疗健康、AI+交通出行、AI+金融、AI+制造、AI+消费品、AI+互联网、数据隐私和安全、算法公平性、产业生态建设、政策法规制定与完善等。

非结构化数据的定义

按照数据类型,企业内的数据可简单分为结构化数据和非结构化数据,前者指的是存储在数据库里,可以用二维表结构来逻辑表达实现的数据,结构化数据占企业总 数据量的 20%左右,基本存储在如ERP、CRM、财务系统等各大应用系统中;非结构化数据指的是不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、 文本、图片、标准通用标记语言下的子集XML、HTML、各类报表、图像和音频/视频、AutoCAD工程图文档信息等,占企业总数据量的80%。数字化转型网www.szhzxw.cn

一、定义——什么是ECM?  

ECM 企业内容管理是一种专注于非结构化数据领域的软件类型, 其涵盖了企业网盘、文档管理、知识管理、文件安全交换、工程协同设计、文件安全外发、档案管理、影像文件管理、电子文档安全管理、文档云、ISO 质量文件体系管理、GMP 质量文件体系管理、非结构化数据管理平台、工程内容管理等应用软件,以及基于 AI 智能和 Graph 知识图谱技术的智能推荐、智能搜索、智能定密、智能安全分析等内容智能应用。ECM 企业内容管理系统可以帮助企业内容管理战略落地,通过内容获取、管理、存储、保护、利用等方式挖掘和释放内容价值,最终促进企业数字化转型,提升企业运营效率,并获得企业商业洞察能力与长远竞争优势。数字化转型网www.szhzxw.cn

Gartner 于 2017 年修正了企业内容管理的定义:企业内容管理是一种服务,包括内容协作平台、内容服务平台和内容业务平台。具体表现为具有通用 API 接口和多储存库的平台型软件,服务于多分支组织机构和各种应用场景。

二、核心技术

1. ECM底层架构技术  

现代化的ECM需要满足各种规模与场景下的国际化和集团化的部署:包括集群架构、分区域架构、联邦架构、混合云架构。同时要支持P级的分布式对象存储并实现冷温热分层、自我恢复。同时支持10亿级海量小文件的极速寻址。目前领先的ECM系统底层架构基于微服务和容器化的云原生(Cloud Native)技术实现。    数字化转型网www.szhzxw.cn

2. 能够满足非结构化数据服务的技术  

内容服务包括不同格式文件转档与预览服务、上传下载在线编辑等文件操作类、文档权限类、内容搜索等,主要技术包括:CSB内容服务总线技术,满足所有服务消费可视化、可计量和可调度;Metadata元数据技术,元数据建模、元数据策略、元数据应用和元数据安全等。可视化数据采集技术,实现与各种应用系统融合。内容数据汇聚一起,经治理后以WebAPI等标准内容服务方式输出。

3. 非结构化数据安全技术  

数据存储安全:基于数据块和多副本技术的数据融灾保障。数据使用安全:通过细颗粒度访问权限控制、密级权限验证和安全域边界权限等技术保证多层数据防护,基于图权限计算模型对深层亿级海量文件进行毫秒级权限计算;数据流通安全:基于内核过滤驱动保证文件在终端不落地,基于智能DLP敏感检测的数据摆渡和外发。数据审计安全:基于大数据和知识图谱技术,保证各种场景化的数据安全审计和分析。

4. 与AI深度融合的非结构化数据处理技术  

在ECM系统中,需要将AI关键技术机器学习、深度学习、NLP自然语言处理与大数据技术深度融合,实现了对文本与图像的智能分类、智能标签、智能OCR识别、智能抽取和生成等,保证从预料、算法、训练、评估、发布和持续迭代的全生命周期管理。    数字化转型网www.szhzxw.cn

结构化D2R自动建图、半结构化Wrapper自动建图和非结构化NLP文本抽取自动建图等技术构成Graph知识图谱,同时融合本体知识图谱、基于语义抽象的主题图谱和文件关联三大图谱,并结合用户画像与行为日志,实现启发式可交互非结构化数据探索,可应用于智能搜索、智能推荐、安全分析、知识创新和辅助决策等领域。

5. 数字化转型相关技术  

为适应企业数据管理能力的提升,需要构建企业内容业务平台,涵盖表单建模、BPM流程引擎和WCM展现引擎,可以实现一次拖拽多端适配,让业务人员具备应用开发能力。另外,如果支持业务组件、接口集成平台、标准WCP工作流控制模式支持,可大大提高开发和维护成本。基于端到端技术的企业数字化能力,与内容形成闭环,能满足企业业务的快速变化与持续创新。

6. 与不同行业的生态融合技术  

与SAP、OA、PDM/PLM、ERP,视频会议等各行业产品快速融合技术,与各种类型存储产品的整合技术,与数据安全加密软件的深度融合技术。数字化转型网www.szhzxw.cn

三、总结

数据就像石油,需要经过提纯加工才能使用,才能实现其资产价值。非结构化文档数据是“数据石油”的重要来源,企业需要遵循分级分类的管理思想,通过平台化、智能化和安全化的管理方法,才能构建出完整的非结构化文档数据管理体系,围绕能给业务带来价值的非结构化文档数据资产进行建设,从而推动非结构化文档数据向数据资产的转化。

声明:本文来自网络,版权归作者所有。文章内容仅代表作者独立观点,不代表数字化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。数字化转型网www.szhzxw.cn

数字化转型网人工智能研习社包含哪些内容

数字化转型网人工智能研习社关注人工智能从技术到落地的全方面,包含机器学习算法、深度学习架构、自然语言处理(NLP)技术、计算机视觉技术、AI+医疗健康、AI+交通出行、AI+金融、AI+制造、AI+消费品、AI+互联网、数据隐私和安全、算法公平性、产业生态建设、政策法规制定与完善等。

本文由数字化转型网(www.szhzxw.cn)转载而成,来源于湖南抉择;编辑/翻译:数字化转型网Jack。

数字化资料下载-思思
免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。http://www.szhzxw.cn/54692.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部