解救“暗数据”:从数据囤积到数据管理

标签:行业动态 / 2018年3月23日

科技越来越发达的今天,尽管数据存储成本已经大幅下降,但是越来越多不受控制的数据 却带来了日益严峻的问题。

你是不是也有“囤东西”的习惯?囤面膜、囤口红、囤耳机、囤手办……如果你得意地认为自己丝毫没有这些奢靡腐败之风,有一种东西你肯定每天都在囤积,那就是“数据”。

旧物品不断堆积,久而久之,房间就会变得拥挤不堪,形同仓库甚至垃圾场。

日常工作中,我们往往也会不经思考地就把每一张照片、每一封邮件、每一个文档都存储下来,有的甚至重复存储。每个员工几乎都在为自己企业数据的无底洞“添砖加瓦”,盲目地存储所有数据,“以备不时之需”的想法在每个员工的心中生根发芽。正因为如此,海量的“暗数据”应运而生。

什么是“暗数据”

电子邮件、即时消息、文档、压缩包、日志文件、存档的网页内容、开发了一半后放弃的应用程序、代码片段……

Gartner对“暗数据”的定义如下:“信息资产企业在日常业务活动中收集、处理和存储但不具备特定用途的数据。”它包括尚未应用于业务、形成有竞争力的情报或对商业决策产生帮助的所有数据对象与类型。

Gartner研究总监Alan Dayl说道:“过去十年数据的指数增长带来了非结构化数据的噩梦。不仅是存储成本,海量的暗数据也让我们错失了很多有价值的数据和这些数据中潜在的商机。”

Gartner预测,到2021年,超过80%的企业将无法在自己的“数据孤岛”中制定一个统一的数据安全政策,最终带来违规、安全漏洞和金融负债等问题。为了对数据增长和安全性作出有效的管理,信息管理员需要部署恰当的工具,帮助员工克服“下意识”的数据囤积问题。

暗数据的机遇与风险

尚未被分析的运营数据可能含有潜在的商机。这些数据可能会产生新的收益或降低企业内部成本。

一些有价值的暗数据包括含网页访问者行为记录的服务器日志文件、显示用户体验反馈与电话定位数据(流量模式有利于制定业务规划)的用户电话记录。

“无论你所在企业机构收集或存储的是什么类型的暗数据,将数据从“黑暗中解脱”出来的关键是确保你具备将其从一种形式转换为另一种形式的方法,并将其轻松地添加至你所使用的分析平台中。”Dayley说。

注:以上部分内容引用自《How to Tackle Dark Data》

实现对海量“暗数据”的价值利用和合理管控,首先要找到这些价值信息,并想方法保护好它们。因为价值信息拥有商机的同时,也面临着巨大威胁,针对这些价值信息的安全威胁也同不断囤积在“黑暗”中的数据一样,时刻存在和累积着。那么,如何降低威胁和风险?我们可以从以下几个方面来考虑。

数据识别

通过深度内容识别技术,对存储在服务器、数据库和文件系统的重要和敏感数据进行检查和分类,找到海量暗数据中的“特殊数据”,清楚了解这些暗数据中的敏感信息具体存放于什么位置。

数据评估

依据法规要求,针对识别到的敏感数据,评估其在存储、使用过程中的合规性,找出数据泄漏风险,及时消除隐患。

数据监控与控制

实时监控各个环节中的重要数据违规发送的风险,对重要信息、有害信息的违规外发行为进行阻止。

数据审计

对敏感信息违规获取、发布、发送的指令级、内容级审计,实现数据全生命周期合规性可视化审计。

不知道如何利用这些大量数据的人永远只是loser。只有那些找到战略性方法并合理利用数据的人才是真正的赢家。停止无效的数据囤积,积极采取行动,根据预期业务结果,对数据进行移动、保护、创建访问权限或删除,才能真正解救“暗数据”,实现对这些数据的有效利用和价值最大化。