大型组织的现代化内容管理之路
标签:行业研究 / 2018年11月1日
作者 | Ftrans飞驰传输创始人&CEO 朱旭光
一、内容的含义
内容数据是企业数据中比较特殊的一部分,主要是非结构化(对应数据库、ERP中的结构化数据)的文档、文件以及一些Web形态的内容。通俗来讲,我们接触到的很多数据都属于这个范畴,小到一封邮件、一份Word形式的工作报告、一篇公关稿件,大到一部电影、一套销售工具、一组设计图纸、一个软件安装包、一个数据库的备份文件等等,所以内容数据是企业数据中比重高、多样性强、管理复杂度也很高的一部分。
二、内容管理的三个阶段
1.0阶段:存储+原生文件系统
最原始的内容数据管理往往是和存储设施密不可分的(甚至可以说是“上古时期”了),从PC、服务器的本地磁盘,到磁盘阵列、NAS、云存储等等,大量的存储资源都在用于存放内容数据。
在这一阶段的IT建设中,企业重点解决的是存储能力和存储成本的问题,而对内容数据的管理、访问和应用,并不是首要的目标,基本通过原生或初级的文件系统来应对,包括网络共享、FTP服务器、手工拷贝等方式。因此,这一阶段对于内容数据的采集、归档以及获取过程,都是分散化而非系统化的,这种内容管理模式显然也是不可持续的。
2.0阶段:无差别的内容管理
内容管理的第二个阶段,开始出现系统化的管理和使用内容数据的需求,企业需要统一存储内容数据,按业务逻辑对内容进行归纳,按用户权限实现对内容数据的访问和获取。
典型的做法是在存储设施之上增加应用层的内容管理系统,比较典型的包括ECM(企业内容管理)系统、基于NAS的同步盘、企业网盘等等。通过这些手段可以实现内容数据的集中式管理和受控的数据访问。目前企业、组织的内容管理,事实上更多处于这一阶段。
但2.0阶段也逐渐暴露出新的问题,主要有几个方面:
一是2.0阶段仍然偏重于内容的静态管理,内容的流通性不是管理重点,而当内容需要快速更新、流动的时候,数据访问的便捷性和安全性都产生了新的问题;
二是ECM、网盘等应用系统,实质上是无差别的内容管理,对于不同类型的数据一视同仁,而无法满足特定业务的内容管理需求,比如对CAD文件的检入检出、对视频文件的粗剪和标注等等,这些需求固然可以由专业的数据处理软件来完成,但同样要求内容管理系统给出必要的支持;
三是内容数据开始和结构化的业务数据发生越来越多的联系,ERP、OA、BPM中带有了越来越多的文档附件,而内容的处理、转移和使用,也越来越需要业务性的审批确认,数据的边界开始被打破,内容管理的集成和自动化成为一个新的课题;
四是云架构普及后,内容数据的产生和存储方式发生变化,一成不变的集中式管理理念和分布式的数据存储应用模式发生冲突,二者都会长期存在,因此必须找到兼容的方式。
3.0阶段:现代化的内容管理
首先3.0阶段目前并没有在完全意义上被建立起来,而是在一个酝酿演化的过程中。但基于2.0阶段的问题,我们大致可以预见到,3.0阶段的一些演进方向。
比如要从静态管理更多地向动态管理进行转变,在动态管理思维的主导下兼顾便捷性和安全合规;要结合组织的业务领域和内容特征,实施个性化或者至少是行业化的内容管理,这一点其实在制造业的DCM、广电传媒的媒资管理等领域已经有相应的产品和解决方案。
但其应用场景和范围还是非常局限的,需要从基础设施、系统层次方面,重新规划组织全局的内容管理方法,包括元数据管理和特定的数据解析分析技术;要更多考虑数据集成、系统集成以及对云架构的支持等问题。
三、大型组织的CIO需要关注什么?
对于内容管理的方案选型,尤其是大型组织的内容管理,我们建议CIO们从以下几个方面来考虑和规划现代化的内容管理体系。
1、内容访问流通的便捷性
系统依然是为业务服务的,这一点从来没有发生过改变。而业务部门优先关心的是便捷性。这就要求内容管理系统要提供更加易用的现代化用户界面。传统的文件系统、肥胖的桌面工具、繁复呆滞的网页,甚至古老的非可视化界面,都要尽快丢入垃圾桶。
商用系统的使用体验越来越趋近于消费级系统,轻量化、扁平化、移动化、互联网化,这些都是大的趋势。这件事说起来容易,但事实上还是很有挑战的,现阶段选型时要关注厂商的产品基因和长期愿景。
2、扩大内容管理的边界
内容管理不再是单一业务部门的事情,而是分布在组织整体的业务流程之中,同时,还会越来越多的涉及到企业外部、组织之间的内容管理和协作,其时空跨度将持续增大。首先要更多地利用互联网,适当开放数据访问边界,去除掉不必要的物理障碍。同时要注重内容数据完整的生命周期管理,其中既涉及业务流程的设计改造,也涉及IT架构和应用系统之间的勾稽关系。
我们建议采用分层级的方式,将内容数据的存储和数据交换能力作为独立的基础设施来看待,形成明确的中间件系统或PaaS平台,在此基础之上采用通用的内容管理应用和系统集成来解决不同复杂度的业务需求。
3、基础设施的现代化
过去和内容管理有关的基础设施主要是存储,现在则越来越多地和网络相关。存储方案现在越来越多也越加成熟,已经不算是一个很大的问题,系统选型时要重点关注对多样化存储库和混合架构的支持。
网络设施算是一个较新的问题。内容数据的访问获取和结构化的业务数据差别很大,最明显的是在数据体量方面。过去通过简单的VPN就能实现全国范围内对集团财务系统的访问,换成内容数据则是远远不够的。
因此需要考虑更先进的网络方案或者对内容数据进行分流,SD-WAN、CDN、广域网加速技术都是值得考虑的,选型过程中要关注厂商的方案整合能力。
4、内容数据的安全和管控
首先还是要解决分布式内容的统一管理问题,是通过数据归集的方式,还是通过构建在分布式存储架构之上的应用层来实现统一管理,我们推荐后者,因为更具备可持续发展的基础。
过去内容数据的安全保护主要反映在存储安全和访问控制方面,而且一定程度上和结构化数据是趋同的,对应产生了灾备、文档加密、DLP等技术性的解决方案,这一部分未来将会逐渐和IoT、AI、机器学习等新技术体系进一步融合和增强。
同时由于内容数据的流通性加强,导致数据保护的业务属性更加明显,共享、协作、协同乃至商务社交都成为内容数据的应用场景,因此单纯的技术性防护是不充分的,需要结合区域政策或行业特征加强合规审计机制。同时,通过业务数据和内容数据的集成,提高内容流转的自动化程度,有效控制人工接触点,实现内容数据应用流程的合规和管控。
四、结语
回到整体,内容管理的诉求和驱动力分别来自业务、管理和IT三个方面,不同角色的关注点各有侧重。业务部门关注的是业务流程的实现和内容获取、协作的效率,管理部门的诉求是集中管控和安全合规,信息部门关注的是全局的数据治理和基础设施的可持续发展。
有些情况下大家的角色和考虑还会有所重合。统一起来看,需要的是效率、生产力,而要规避的是来自数据、监管和投资方面的风险。
而对于大型的企业和组织,内容数据的管理是未来三到五年内无法绕过的一个课题,这里面既有信息技术和IT架构的变革带来的共通性的影响,也有不同行业业务特征带来的差异化因素。
其中平衡取舍,需要CIO们具备更开阔长远的视野,提早出发,预先做好技术体系、解决方案的储备,通过分阶段的规划和实践探索,来完成内容管理体系的现代化历程。