哪家静态数据脱敏的操作流程比较简单?

产品全称”绿盟数据脱敏系统(NSFOCUS DMS)”,DMS支持变形、转换等多种内置脱敏规则,能够降低数据的敏感程度。DMS能够量化敏感数据重识别风险,做到敏感数据可用不可见、所需方可见,是一款集静态脱敏、动态脱敏、脱敏后数据残留风险评估多功能与一身的的综合性脱敏系统。

产品具备多种高性能硬件形态,同时支持部署于各种虚拟化以及阿里云、腾讯云、华为云、AWS,Azure等云环境。

}

4月12号推特上有个叫@Bank Security的账号发了一条消息,说有人在卖中国多个的银行用户数据,只卖美元3999。包括姓名、年龄、地址、电话号码、身份证号、存款金额、所办业务等金融数据等等。

我果断去Twitter上看了一眼,果不其然。截图里的敏感信息已经被挡住了,不过Twitter上还都是明文,名字电话身份证都清清楚楚,还有什么CEO的公司,行业,业务情况,家庭住址什么的一应俱全。在示例里展出的银行客户会不会被吓出一身冷汗,反正我是细思极恐的。

昨天神州数码TDMP数据脱敏系统在华为鲲鹏ARM服务器上拿到了认证。

今天我想聊的是这个TDMP数据脱敏系统到底是用来干啥的。数据脱敏是数据库安全技术的一种,英文是Data Masking(DM),直接过来翻译过来可以是数据屏蔽,英文里也可以用Data Obfuscation,数据混淆。但是不知道为什么翻译成中文就成了数据脱敏(Data Desensitization)。好吧,可能是为了混淆吧,一个蛮清楚的名字就这么被混淆了。不过没关系,我们继续用国内的“数据脱敏”这个名词来称呼他。

什么是数据脱敏?(What)

数据脱敏是隐藏原始数据与修改的内容(字符或其他数据)的过程。对数据脱敏的原因主要是为了保护个人身份信息,敏感个人数据或者商业数据,也就是刚才我们在推特上看到的那些客户信息。

数据脱敏最大的要点,在隐藏了数据之后,数据必须要保持可用,而且看上去也要像真的一样,否则我们就直接把这些信息都改成ABCD就好了。

比如某个人叫张三,要把他改成李四。手机号码也要变成不存在的号码,但是还是得有11位,不能变成字母。身份证号和信用卡号也要符合规则,比如身份证特定几位必须是生日,信用卡的奇偶校验那一位必须是正确的,否则将会变成无效卡号等等。

上面这个还是简单的,数据脱敏还需要在各个级别上都让数据有意义,比如混淆地址,必须要保证是一个正确的地址,而且还要让邮政编码是正确的,这通常会跨数据库的多个字段。又比如某个人力资源系统里,一个员工的职位是工程师,那么这个职员关联到的另外一张工资表上的工资,不可以是一千万,否则就出了大笑话。还比如说某个呼叫中心的客户接到了银行的客户投诉,这个客户如果是一个VIP客户,就必须要匹配到客服数据库里面的相关客户等级和服务。

所以数据脱敏主要的工作不是把数据藏起来,而是把数据弄得跟真的一样,还不能是真的。

我们为什么要做数据脱敏呢?(Why)

我说了,数据脱敏是数据库安全里的一个技术,主要是为了数据库安全。就像我们上面举的银行客户数据泄露的例子,如果核心数据库能做到完全不能对外访问,读取的都是脱敏的数据,那么这种敏感信息泄露的事情就不会发生。

当然以上的讲法是不现实的,毕竟生产系统还是要使用真实数据的,在很多情况下开发工程师或者运维工程师要做系统测试,做软件开发,都需要用到相关数据。直接把生产系统数据给开发人员,风险是非常大的,万一这个工程师对公司有怨念,或者对领导有想法,或者人品不好,就很容易把数据泄露出去,造成巨大的损失。

为了避免这个问题,我们在测试环境当中,就必须使用脱敏之后的数据,而不是真实的生产数据。尤其是对数据安全要求比较高的金融医疗等行业。比如根据支付卡行业数据安全标准(PCI-DSS),还有医疗行业的HIPAA标准和欧洲通用数据保护条例(GDPR),数据脱敏都是必不可少的。

随着云计算的快速发展,数据脱敏对更多的行业也越来越重要。如果我们的生产数据放在IaaS,PaaS或者SaaS上,数据必须要保证安全。随着DevOps流程的更加成熟,软件开发流程(SDLC)里也需要加上数据脱敏的内容。

那么数据脱敏有谁在玩呢?(Who)

按照Gartner的说法[1],数据脱敏可以分为静态数据脱敏(SDM),动态数据脱敏和非结构化/半结构化编校 (USR),分别用在静态数据,数据传输和日志数据等领域的安全,细细看来,在每个领域都有很多巨头玩家。像微软啊,IBM,Informatic,Oracle,博通啥的都在里面。

神州数码的TDMP牛在哪里?

不看不知道,一看吓一跳,玩法其实是站在巨人的肩膀上做点具体和本地化的工作。

正如我一开始说的,要把假的做成假的很容易,要把真的改成假的也很容易,但是要把真的改成假的,还得像真的,就很难了。

上面那些玩家都是牛哄哄的全球大公司,不过在中国这个市场,“安能辨我是雌雄”好像是个核心竞争力。

其次是和大厂一起搞。什么意思呢?Microsoft,Oracle这些公司做这个很多年了,技术上很专业,但是核心的规则和逻辑,在不同的行业却各有不同。我们能建立在他们的基础上,用核心的逻辑,更新他们的数据脱敏算法,从而达到效果更好,数据更真实,效率更高的优点。

此外,我们所有的代码都是自己一行一行打出来的,不是开源的复制过来改改,所以所有的代码可以挖到每一行的原理和逻辑。

当然吹牛谁都会,我说的别人也都能说。鉴于这事情我们干了将近十年,在各银行金融机构的实验田里秒杀了无数竞争对手,昨天又有了华为鲲鹏的认证,目测大概又能甩开竞争对手几百米。

当然,这事情还得不断跑下去,稍微歇一歇就会被人赶超,要创新,就是得不停锻炼身体不停跑。听张文宏医生的话,多喝牛奶多吃鸡蛋,打好基础长期在舒适区外奋斗,在这数据安全的路上小跑下去,保证自己以后“不会因为碌碌无为而悔恨,也不会因为虚度年华而羞耻。”

本公众号内容仅供参考,如需转载,请您注明出处和保持信息完整性。如有未注明作者及出处信息或图片,请版权所有者联系我们,我们将及时补上,感谢您的辛勤创作。

}

以测试数据管理方法论为支撑,辅以高效的 ETL 处理引擎,融敏感数据发现、人工审批、规则配置、数据切分、数据脱敏、行为审计等功能于一体,内置可配置及可扩展的丰富的基础脱敏规则和敏感数据特征码,可实现快捷的逻辑扩展。简练美观的 Web 用户界面提供了完成所有测试数据管理工作的访问入口。整个数据脱敏逻辑满足高仿真、低敏感度的要求,同时实现了对数据引用完整性和一致性的保证。

作为全球首屈一指的数据治理专家,Informatica 根据自己多年的专业技术和经验,提出了全面数据安全管理平台的概念,并推出一系列数据安全解决方案,Informatica 测试数据管理(Test Data Management,简称 TDM)解决方案就是其中之一。

针对于不同业务特性、不同数据特性的客户,提供策略性、一体化的方法,对某些敏感信息利用智能化的平台和预制的规则,有效地进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在生产、开发、测试以及外包或云计算环境中安全地使用脱敏后的真实数据集。借助数据脱敏技术,屏蔽敏感信息,并使屏蔽的信息保留其原始数据格式和属性,以确保应用程序可在使用脱敏数据的开发与测试过程中正常运行。Informatica

§  全生命周期的敏感信息保护和管理

通过完善和制定生产数据使用管理制度,明确生产数据中敏感信息数据字典规范和生产数据申请、提取、安全预处理、使用、清理、销毁等环节的处理流程,根据生产数据中敏感信息数据的相关信息采购符合银行业务情况的脱敏工具,并明确在生产数据使用过程中所涉及部门的职责分工,提高生产数据使用管理规范化、制度化水平,防范生产数据泄露等安全隐患,完善信息科技风险管理体系。

Informatica数据测试数据管理方案,拥有全面的技术与算法,包括随机脱敏、模糊脱敏、键值脱密、替换脱密等。和内置的专门的规则,包括名称和地址规则,证件号,信用卡号,电话等专门的处理规则。同时为了适应银行广泛使用的商业软件,Informatica数据脱敏方案独有的与所有主流商业套件无缝集成的能力,可以直接将商业套件中的业务规则抽取出来,而不必人工开发或导出,大大加快了系统上线和实施的速度和便利性。

对于安全的信心应该来自于在整个生命周期中对生产数据风险的识别、关注和准备。Informatica数据安全解决方案,可以帮助银行通过建设生产数据管理体系,加强敏感数据的安全管理,推进数据脱敏工具化、流程化,提高银行敏感数据防护水平,健全银行信息安全管理体系。

数据敏感漂白处理,通常是针对数十个应用,不同的数据库,上百张表进行处理,使用Informatica TDM,能够实现数据脱敏的灵活配置,零编码,多种脱敏规则与算法。在整个脱敏过程中数据无需落地,并可借助网格(Grid)计算、并行分区处理(Partitioning)等技术获得极高的数据处理性能。

Informatica TDM能够在字段级配置脱敏规则算法,经过脱敏的数据能够保持数据原有的格式、业务特征和数据之间的主外键关系或逻辑关联关系。

借助Informatica TDM解决方案,通过建立统一测试数据安全管理平台,公司将可以获得以下收益:

§  图形化的部署、控制和管理统一数据安全管理平台,简化测试数据管控的复杂度,即满足数据安全合规,同时满足数据管理者、使用者等多方面的不同需求;

§  实现对企业内所有业务系统测试开发等非生产环境的数据安全管理;

§  提供统一的方法与规则产生测试、开发、培训等非生产环境所需的数据;

§  以生产环境中真实数据为基础,通过高效的脱敏技术产生测试可用的安全数据,消除敏感数据暴露的机会,从而降低数据泄漏的风险;

§  建立统一数据脱敏平台,支持现有和未来业务系统建设的数据服务;

§  助力企业合规性管控,提高企业应对政府监管的能力与基础;

§  助力企业实现跨地域的、跨业务系统的数据一致化安全管理水平,提高企业竞争能力,保护企业市场形象;

§  助力企业全局数据治理的建设路线。

下图展现的是Informatica测试数据管理(TDM)的物理架构,它包括几个主要的组成部分:一、数据脱敏&数据子集工作台;二、数据脱敏&数据子集引擎。

数据脱敏&数据子集工作台是一个基于web浏览器的开发、管理界面,用户可以通过单一的Web界面实现测试数据管理的绝大多数功能。包括,规则定义、工作流管理,运行监控等。

这一引擎是建立在Informatica V10平台上的数据处理的引擎,提供外部数据的访问能力,包括:访问企业内部商业数据库,访问商业应用套件,访问文本文件,云服务等;提供平台的扩展能力,如集群、并行处理、HA等;同时整个测试数据管理的知识库也在这里管理,提供了一致的元数据和集中的规则存储。

同时这个模块提供复杂规则的二次开发能力,用户同样可以通过图形化的界面进行复杂的脱敏规则的开发,并支持将二次开发的规则与浏览器界面进行集成。

从技术上而言,数据脱敏属于数据加工处理的主题化分支,而TDM后台采用的Informatica PowerCenter引擎正是业界数据加工处理平台中的佼佼者。通过TDM WorkbenchPowerCetner相结合,IT人员与业务人员分工配合可以实现最大程度上的功能可扩展性。

提示:使用API方式购买云市场镜像前,需先认真阅读并认可相应的镜像协议。

产品价格(此处价格仅供参考,实际价格以选配后的价格为准)

}

我要回帖

更多关于 数据脱敏的原则 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信