当前位置: 首页 > 范文大全 > 公文范文 >

大数据安全与隐私保护关键技术研究

时间:2022-03-28 08:23:21  浏览次数:

摘 要:社会信息化和网络化的发展导致数据爆炸式增长,其中的隐私泄露和安全问题也格外引人注目。本文从隐私性、可信性两个方面阐述大数据的安全问题。其中有四种大数据安全与隐私保护技术:数据水印技术、数据溯源技术、社交网络匿名保护技术以及身份证认证技术。目前大数据的实际运用非常广泛,大到交通管理,小到数据分析,都为人们的生产生活提供了专业的理论依据,从而保证数据被合理高效的使用。然而大数据为人们的生活带来便利的同时,也带来了安全威胁,由此大数据的安全与隐私保护变得越发重要起来。

关键词:大数据;匿名保护;数据挖掘;隐私保护

一、引言

当今世纪,科技的发展为人们带来了翻天覆地的变化,从以前的模糊理论,到现在发展的机器人技术。从机构算法、语音、图像识别、立体跟踪、AI识别、VI模拟技术,再到无人驾驶、无人机技术。这些都离不开后台大数据的支持与保障。大数据因其处理数据规模大、速度高、多样的特点,从而得名。科技发展让大数据得以全面铺展,社会行为的方方面面得到长足的应用。随着大数据的深入发展,其所带来的安全问题与市场价值成为人们关注的焦点。

1大数据安全与隐私保护研究背景和研究意义

数据处理不当会给数据管理与收集带来严重威胁,甚至会导致部分数据泄露。例如当健身房推广业务时,营销策划会想方设法找来一些同行业的数据,这过程中如果因为某种原因造成会员的资料泄露,可能会对顾客的隐私造成极大的伤害。如果资料泄露甚至会发生特别严重的后果。在商业化应用中,用户也有权力对自身的隐私进行保护,接洽的商业机构也有责任和义务对其隐私进行保护。

二、大数据带来的安全与隐私保护的挑战

2.1大数据中的用户隐私外泄

随着计算机的高速发展,虚假信息传播的速度与日俱增,某些大数据的持有者,像单位和个人在数据挖掘之始,就存在鱼目混珠的现象。从而在数据收集的过程中对于数据的泄露持无所谓的态度。他们明知道一部分数据造假,还通过平台与媒体向社会披露,如果假的数据被认同,那么造成的伤害更大。就商业行为而言,适时变通无可厚非,但有目的性的造假从而获取私利就是不负责的数据传播。从而让需要这些数据的使用者得到错误的理论支持,导致数据混淆,造成非常重大的损失。人们使用大数据之前必须要保证数据的真实性,并应该在数据的传播过程中严格控制,提高数据的可信性。

当人们进行数据采集的时候可能会产生误差,这种误差应该保持在允许的范围内,如果影响了最后的准确性,那么就是伪数据。例如,某电视台在播报体育赛事时,主持人带情绪性的偏向某一方,这种类型的数据往往回影响最终结果,失去了体育精神中的公平性原则。数据的失真很大程度是由于人为干预所引起,还有一些历史的早期数据对这些结果也产生深远影响,从而造成大数据可信性降低的现象。有些是在数据产生的过程中发生不可预支的情况,有些是在发生的过程中有能力控制行为人的举动,从而导致这些数据偏离预定的轨道,得到了与原来数据截然不同的结果。这些伪数据根本表达不了真实的信息。反而会让关注的人产生不想预见的结果。

2.2缺失大数据的规范管理

现如今,我国政府和有关部门还没有制定专门的有关大数据信息安全和用户隐私保护的法律法规,对于当今大数据的监管主要还依靠企业的自觉和个人的职业道德,当真的出现大数据安全和用户隐私泄露时又没有进行及时止损,由此而造成的损失则会越来越大。

三、大数据安全与隐私保护关键技术

3.1数据发布匿名保护技术

数据的匿名处理,信息可以公开发布了,事情证明,匿名保护技术这种方法并不能达到对隐私保护的理想效果。隐私识别技术在现在科技发展的过程中也多种多样,以破解简单的办公文档密码为例,如果加密者是网站的所有者,那么密码被撞库的机率是很大的,偏巧文档又有商业利益,那么行为人就会拿着现在的文檔在网站的关键字是做文章。从网址,网址延伸、再人肉加密者的名字、简称。很大机率会因为用心做这件事而使用加密文档遭到破解。相关的资料是属于敏感属性,对识别技术而言,隐私是其需要攻击的对象也是工作。找到方向破解相关的数据就会事半功倍。但匿名保护而被识别的主体转移,那么匿名保护的结果又有何意义呢?

3.2社交网络数据的匿名化隐私保护技术

社交网络数据的匿名化隐私保护技术指的是在计算机网络和数据库中运用对敏感信息进行模糊、隐匿和清洗的过程,从而将用户隐私的泄露风险降低到最小水平。社交网络具有图结构的特征,社交网络间的数据并非相互独立,而是存在着某种关联,或者是协同关系或者是关联关系,所以数据攻击者有可能通过一种数据信息推测得出另一种数据信息,也可以通过公开信息去推测隐匿的信息,任何技术都无法保证万无一失。

3.3数据水印技术

数据水印技术最常用的方法是将来有标识信息的数据嵌入到本体内部,对数据的使用不影响的一种方法。数据水印技术在媒体版权、文本文件和数据库保护中都有着广泛的应用。拿电子读物来说,它是在电脑或手机客户端建立的一种可视化的应用。里面不缺传统杂志的图文并茂,同时又可插入声音和录像的一种新媒体媒介。甚至有些还可以二次开发有互动功能。辛辛苦苦做的电子杂志如果不加防伪技术很容易成为被恶意盗版的对象。这时数据水印就派上用场,它可以暗影的形式存在于媒体中间。盗版者要处理掉就需要耗时费力。并且效果不很好。如果不处理在放送的时候很容易就会被识别。从而达到保护版权和合理利益的作用。用于社交的多媒体终端技术层出不穷,像阅后即焚。延时转移等也越来越人性化。像水印防复制、抗衰减。水印识别技术相同出一辙。

3.4风险自适应的访问控制

风险自适应的访问控制主要适用于因为数据安全管理员缺乏专业大数据安全管理知识,缺少为用户指定访问数据经验的大场景中。我们可以提前设置一个访问的预定门限,当某一位用户在进行大数据访问的过程中超过了这一预定门限,就对其采取限制措施,使其不能再继续访问,当然这种门限要综合考虑多方面的因素。

四、总结

虽然大数据给人们生活带来了便利和效益,也同时有了威胁。要将信息安全放在第一位。实现大数据的安全也隐私保护就需要用数据溯源技术,身份认证技术、数据水印技术、社交网络匿名保护技术等相关的技术,同时要建立相关的政策法规,只有通过技术手段与政策法规想结合,才能更好对大数据的安全和隐私进行保护。

参考文献

[1]胡茶升.论大数据安全与隐私保护技术[J].科技与信息,2018,(19).

[2]曾琴.大数据环境下隐私保护及其关键技术研究[J].数字技术与应用,2018,(07).

推荐访问: 技术研究 隐私保护 关键 数据