欢迎来到中连智浩官网! 收藏本站 | 联系我们

防城港市技术交易平台
服务热线0771-4796827

科技资源

TECHNOLOGY RESOURCES

您当前的位置: 首页> 科技资源> 成果展示

发明专利转让:事务型数据流发布的隐私保护方法

发布时间:2023-11-15分享到:

【专利名称】事务型数据流发布的隐私保护方法

【专利号】2016111986013

【申请日】20161222

【法律状态】专利权维持

【专利权人】 广西师范大学

【发明摘要】本发明公开一种事务型数据流发布的隐私保护方法,其采用了滑动窗口对数据进行匿名,滑动窗口能够很好地处理最近数据信息,从而保证任何滑动窗口都满足隐私要求并尽可能大地保持数据的有效性,以便数据挖掘者进行分析。

【发明内容】

技术领域

本发明涉及数据安全技术领域,具体涉及一种事务型数据流发布的隐私保护方法。

背景技术

随着网络信息技术的高速发展,为满足商业决策、科学研究等需求,大量含有个人隐私信息的数据被政府部门、商业机构等存储发布。数据发布作为信息共享的一种手段,在为数据交换和数据共享提供便利的同时,也对数据的隐私带来严重的威胁。如果数据发布者不采取适当的保护措施,将会造成敏感数据的泄露,从而给数据所有者或企业带来危害。数据发布中的隐私保护问题主要考虑以下两个方面:①保证发布的匿名数据不泄露个体的隐私信息;②保证发布的匿名数据具有较高的可用性。其研究工作主要集中于如何设计隐私保护模型和数据处理方法更好地平衡隐私保护和数据可用性之间的矛盾。

事务型数据是一种常见的数据形式,它的每条记录是一个项目集合,如用户的购物数据等。对于事务型数据,如果只做简单的匿名处理就进行发布,并不能保证用户的隐私不被泄露。假设攻击者知道某个人的部分项目,如果只有少数几条事务记录包含这些项目,那么攻击者就可能将个人与某条记录对应起来,从而获得记录中个人的隐私信息,如购买的敏感商品。事务型数据是高维稀疏的,相对于关系型数据而言,对其发布的隐私保护技术提出了更大的挑战。由于数据挖掘的广泛应用,事务型数据发布的隐私保护问题引起了研究者的广泛关注。

根据是否区分敏感项目和非敏感项目,事务型数据发布的隐私保护方法分为两类:

一类是沿用了传统关系型数据隐私保护的思维,将所有项目分为敏感和非敏感项目,并假定攻击者的背景知识局限于非敏感项目。该类方法有:(h,k,p)-coherence隐私规则,该规则确保对于任意小于p个非隐私项目的组合,在处理后的数据中至少有k条记录包含这个组合,而且含有隐私项目的记录所占到的比例至多h;ρ-uncertainty隐私规则,假定攻击者的背景知识不仅包含非敏感项目,同时可以包含敏感项目,限制隐私关联规则置信度不超过ρ。

另一类没有区分敏感项目和非敏感项目,一个项目同时是敏感的也是非敏感的。该类方法有:km-匿名模型,保证匿名后的数据集中,任何大小不超过m的项集的事务数至少为k,限制了攻击者的背景知识不超过m,实际应用中攻击者的背景知识很难确定;k-匿名模型,不限定攻击者的背景知识,保证任意记录在数据集中有k-1条记录与其相同。

然而,上述隐私模型及其相应的匿名方法都是针对静态事务型数据的。随着物联网的推广以及大数据时代的到来,网络点击数据、电话呼叫记录、网络交易数据、大型超市的购物数据等通常表现为动态变化的数据流。为了实时分析用户的行为,需要在数据流上连续地执行挖掘算法,如果不经过处理,用户的隐私信息将被泄露。数据流具有海量性、实时性和动态变化性,传统的隐私保护技术不能直接应用于数据流环境中。这就需要针对事务型数据流设计新的隐私保护技术。

发明内容

本发明针对事务型数据流发布的隐私保护问题,提供一种事务型数据流发布的隐私保护方法。

为解决上述问题,本发明是通过以下技术方案实现的:

事务型数据流发布的隐私保护方法,具体包括如下步骤:

步骤1、将初始滑动窗口的数据转换成覆盖集,并用静态匿名方法对其进行匿名使其满足ρ-uncertainty(ρ-不确定性)并发布;

步骤2、对滑动窗口进行动态匿名,根据删除和增加的事务建立受影响的敏感关联规则树ASRT,并用payoff树对项目进行抑制;

步骤2.1、对敏感关联规则树ASRT进行初始化,建立根结点和第一层结点,所有敏感项目作为第一层结点;同时,初始化前缀长度标识m,令m1

步骤2.2、对删除和增加的事务进行分析,更新覆盖集,将受影响的前缀长度为m的敏感关联规则的前缀加入敏感关联规则树ASRT,根据覆盖集和敏感关联规则树ASRT找到前缀长度为m且不满足ρ-uncertainty的敏感关联规则;

步骤2.3、根据payoff树计算信息损失,删除步骤2.2找出的敏感关联规则中包含的项目,直到敏感关联规则集为空,并利用删除的项目更新覆盖集、ASRT和滑动窗口;

步骤2.4、令m+1,重复步骤2.22.3,直到不存在受影响的前缀长度为m的敏感关联规则;

步骤2.5:当前滑动窗口满足ρ-uncertainty并发布。

与现有技术相比,本发明针对的是具有海量性、实时性和动态变化性事务型数据流,特点如下:

1.为了适应数据流的特点,本发明采用滑动窗口技术,决策者通常最关注近期数据情况,而滑动窗口能够很好地处理最近数据信息。为了保护隐私,要求滑动窗口中的数据满足ρ-uncertainty规则。

2.对于任何滑动窗口,为了满足数据流实时性要求,需要快速匿名并进行发布。本发明不用扫描整个窗口的数据,只需要根据删除和增加的事务作处理,就可以达到隐私要求。

3.对删除和增加的事务进行分析,就对敏感关联规则的影响情况,根据ρ-uncertainty规则分四种进行考虑,并据此建立受影响的关联规则树ASRT,从而找到违反ρ-uncertainty的敏感关联规则并进行抑制。

【附图】


【合作方式】专利权转让

【价格】面议


点击这里给我发消息
二维码