数据生命周期变化促使数据安全进化

从“大数据”概念诞生的那一刻开始,数据安全就又被业界提升到了一个新的高度。随着大数据应用越来越多,数据成了企业获得利润的核心资源之一。

从2012 年第四季度开始,阿里巴巴的净利润已经超过了腾讯、百度,跃居国内最挣钱的互联网企业排行榜第一名。

据业内人士分析,此次阿里巴巴寻找到的新增长点即在B2C 领域—而这一领域新增加的收入多数来源于基于大数据的精准广告。
当数据变成可以获利的资源,这就使人们更加重视其安全性。

事实上,大数据除了可以创造新业务之外,同时也能显示出企业某些的核心信息。彭博社与高盛之间的纠葛,就是这样一个例子。

据《纽约邮报》5 月10 日报道,彭博社一名驻香港记者曾询问高盛一合伙人是否离职,因为他事先了解到该合伙人在过去几周没有登录彭博数据终端。高盛在发现彭博社记者掌握其“内部”信息后,愤而向彭博投诉。

这一事件令业界开始警醒,在大数据时代,数据安全需要被重新审视。

传统数据安全的进化

要想弄明白大数据时代数据安全面临的新问题,我们还需要重新梳理数据的生命周期。

通常来说,传统的数据安全往往是围绕着数据的生命周期来部署的,即数据的产生、存储、使用、和销毁。

众所周知,一直以来各个行业在数据存储的安全上下的功夫最大。其中包括使用大量归档、备份等等防止数据丢失的产品。曾经有用户担心,到了大数据时代,这些常规安全产品是否就已经过时了?

答案显然是否定的。在大数据时代,这些产品首先要解决的就是产品的进化。

赛门铁克公司首席安全解决方案架构师李本说:“在大数据时代,常规安全产品要想继续发挥作用,需要解决的问题是:如何根据数据存储和处理的动态化、并行化特征,动态跟踪数据边界,管理对数据的操作行为。解决了这个问题后,由于安全防护的层次继承性,常规安全产品会继续发挥作用。”

在李本看来,这并非是单一某一类产品的问题,而是围绕着数据安全整个链条在大数据时代都会遇到的问题。

事实也确实如此,信安世纪就在大数据的推进过程当中就遇到了这一问题。

信安世纪总工程师汪宗斌说:“这个问题要从密码学的角度来理解。原来加密技术通常都是对数据加密之后存储,使用的时候再解密。而现在到了大数据时代,我们就发现了两个问题需要解决:第一,是对海量数据加密之后,密文一旦出问题,数据基本就等于毁掉了,无法再次使用。第二,是对于海量数据无法在加密之后检索。这就为大数据的应用带来了一些困难。”

大数据时代的数据安全

实际上,大数据时代的到来,使我们不得不重新审视我们现有的数据安全理念。

那么,大数据时代,我们应当怎样看待数据安全呢?

启明星辰核心研究院资深研究员周涛说:“将数据安全更深入地嵌入到数据的生命周期当中去,才是未来的发展趋势。”

但,问题是,随着大数据时代的到来,以及数据的“云”味越来越浓,数据的生命周期也发生了新的变化。

随着大数据应用越来越多,原来数据产生、存储、使用、和销毁的生命周期,逐渐转变成了数据的产生、传输、存储、和使用。

随着数据生命周期的变化,数据安全的每一个环节也都随之发生了新的变化。

使用中的安全更为敏感

迈克菲华北区资深售前工程师程智力认为,大数据不同于传统数据的主要特点有个:“第一,大数据是必须建立在一定数据基数上的;第二,海量数据不等于大数据,大数据是企业所需要的答案,而海量数据只是提供这些答案的素材。”

这也就意味着,大数据时代的数据安全必然是建立在数据的使用上的。周涛也在此事上持相同的观点:“以彭博社事件为例。实际上登陆记录在普通人眼中看来,不过是一些简单的数据而已。而在有心人的眼中,这些数据却能够提炼出价值非凡的信息。”

在周涛看来,大数据时代的首要特点,就是数据的拥有者和管理者相分离。

“譬如我们登陆了某一网站。理论上,你何时登陆的,在哪里登陆的,进行了哪些操作,这些信息都应该是属于你个人的,是你的个人隐私。但是,这些数据却并不存在于你的电脑上,而是在网站的服务器里。就是拥有者和管理者的分离。”周涛说。

以往,这些数据只是一些单条的数据,但是,随着大数据时代的到来,这些数据开始被当做有因果关系的数据,其能够起到的作用就越来越多。而经过处理和分析后的数据结论更是价值非凡。

因此,数据使用当中的安全问题开始被大家所重视。

李本说:“数据安全最关键几个环节是提取数据特征,识别并定义数据的安全边界,定义数据的正常访问场景。就是所谓的数据风险评估(datarisk assessment),因为若要想对一个客体实施防护,必须先明确这个客体的特征是什么、在哪里实施防护,哪些动作是对数据有害的,这是实施数据防护的基础和前提。尤其是在大数据时代,定义数据边界,识别和区分正常和非正常访问变得非常重要,因为大数据有个非常明显的特征,那就是数据是分布式存在的,对数据的处理是并行的。常规的安全手段很难在这种环境下发挥作用。”

周涛认为,大数据使用当中,模糊的边界是大数据时代需要面对的问题之一。由于管理者负责管理的数据从某种程度上来说,是拥有者隐私的一部分,而这些数据的使用实际上是没有通过拥有者的同意的。因此,未来需要第三方监控软件来帮助拥有者保护这些信息。

而在程智力看来,这些大数据时代的数据泄露,实际上对企业来说风险更大:“由于这些数据都是处理过的,因此,大数据时代的数据安全要求更高。”因此在人员的管理当中,防止人员通过打印、拷贝泄露这些浓缩过的数据也是非常重要的。

数据中心的安全地位更为凸显

在程智力看来,数据中心的安全是大数据时代数据安全的重中之重。事实上,程智力的这一想法在业内颇有共识。不少企业现在已经围绕着大数据开始思考如何打造自身的数据中心解决方案。

那么,什么样的解决方案会受到业界的认可呢?

众所周知,大数据与云有着千丝万缕的联系,因此,分析数据中心的安全,自然离不开云。现在我们最为常见的,还是公有云和私有云两种类型。

在周涛看来,私有云如阿里百度等等并不开放,用传统的数据安全技术既可以保障安全。而是公有云,则受到大数据的影响带来了更复杂的安全威胁。

多租户使用的威胁是其中的一种。

在数据大集中的时代,数据中心中多租户的存在时不可避免的。这些用户要有隔离的安全性,但是又要公用一个资源池。因此,迈克菲采取的策略是,不去预设哪些行为是危险的、不可进行的。而是像ATM 机一样,只设置哪些行为是可以进行的。

程智力说:“实际上,数据中心的安全在大数据时代之所以尤为重要,除了多租户的问题之外,网络运营商大规模使用数据中心也是重要的原因之一。因此,我们常说数据中心的安全是数据安全的基础。”

正是由于这些原因,李本才更为看好基于主机的安全防护产品。

“由于计算资源和存储资源是动态变化的,数据的处理是并行的,而且防护措施必须从网络层面提升到数据层面,常规的静态边界防护模型和防护产品的作用越来越小了,基于主机的安全防护产品将获得更广阔的发展空间,当然,这类产品也需要进化,解决防护范围和防护策略在动态环境下能够快速同步的问题。”李本说。

传输中的危险

在汪宗斌看来,传输中的危险从没有像大数据到来之后这样严重:“我们有很多客户是金融行业的,他们原来很多都采用专网来运作业务,但是,随着云时代和大数据的到来,仅仅是专网已经不能满足他们的需求了。现在有很多客户都走运营商。”

事实上,汪宗斌认为,在传输当中的威胁一直都存在:“比如邮件的传输也是会遇到相同的问题,这个问题由来已久,但是似乎大家默认这是安全的。而金融客户的数据传输则不同了,因为他们的数据非常敏感。我们现在已经有一套比较成熟的解决方案来应对这一问题。”

汪宗斌表示,相似的问题也会出现在其他的行业当中。

而在周涛看来,数据在传输当中的安全保障应该仰赖数据中心或者说是运营商的安全建设。

在大数据时代,只用专网而不用公网的现象可能会逐渐消失,因此,在传输中为人们服务的运营商的数据安全建设就更为重要。

渠道的机会

那么,大数据的来临对于渠道而言到底是福还是祸?

汪宗斌认为,大数据的来临,使渠道在大型项目上的竞争优势明显减弱。

因此,安全渠道需要去中小企业当中开辟市场。

事实上,现在安全即服务的概念逐步开始被人们所接受。因此,渠道要想获得更多的商业机会实际上还要思考如何在大数据领域为客户提供服务。

上一篇: RSA:大数据是为用户量身定制安全服务的关键
下一篇: 如何解决PHP startup: Unable to load dynamic library的错误