主页 > imtoken苹果手机 > 微众银行区块链张凯祥:区块链隐私保护的挑战与应对

微众银行区块链张凯祥:区块链隐私保护的挑战与应对

imtoken苹果手机 2023-04-03 06:10:18

近日,微众银行首席区块链架构师张凯翔做客香港海航“AI金融”系列线上讲座,主题为“区块链隐私保护的挑战与应对”,探讨区块链如何为数据隐私构建平衡和信息公开。

以下为张凯祥演讲全文,雷锋网《AI财经评论》不改初衷做了整理:

我是微众银行的张开祥,我们团队从2015年开始研究区块链。

在谈区块链和隐私保护之前,我们先简单了解一下区块链的概念和分类。

首先,真正的区块链必须在分布式网络上。 积木有序列号和高度。 区块是一个接一个的产生,相互依赖,这样数据才能得到严格的校验,不丢,好,不乱。 然后使用密码学来验证数据的稳定性、可靠性和完整性。

比特币分叉对比特币的影响_比特币策略软件_比特币的隐私保护策略

底部两层加起来更像是一个分布式数据库或分布式网络。 业界有一个笑话,它是最慢的分布式数据库。 比如比特币的TPS是7(pen/second),以太坊大约是10+。 我们联盟链其实快很多,目前单链TPS在2万左右。 性能优化的主题来了。 分布式这么慢,它有什么价值? 它的价值在于多方协作。 区块链的灵魂和核心是什么? 共识。 没有多方智能合约和共识算法来实现透明、高效、可信的合作,它只是一个分布式数据库。 多方合作是为了什么? 一定是为了资产交易和数据共享。 计算和数据共享基于智能合约的透明规则,大家共同执行。 这就是区块链。 区块链的基本属性是什么? 在介绍隐私保护之前,我们先了解一下区块链是如何组织这些数据和规则的。 首先,在每个节点中,都有相同的块数据结构。 简单地说,每个区块包含一批交易。 每笔交易都可能反映一次资产的转移,比如a转100元给b。 这个交易必须是事务性的,交易执行结果在所有节点上都是一致的。 这该怎么做? 即通过共识和数据同步,意味着所有数据都将存储在链上的所有节点中。 如果这个链接进入了10个节点,10份数据是完全一样的; 如果是10000个节点,那么数据就保存10000份,完全一样。 一个字节是好的比特币的隐私保护策略,没有丢失,这意味着每个人都可以看到这个数据,也可以验证这个数据。 (如果)少数人篡改数据,其他人可以通过共识和验证拒绝修改,发现修改后惩罚篡改者。

比特币分叉对比特币的影响_比特币的隐私保护策略_比特币策略软件

因此,区块链可以达到以下效果: 第一,数据难以篡改。 改变必须拥有50%以上的算力,或者串通链上全部或大部分共识记账节点。 仍然可以进行篡改,但这非常困难,几乎不可能。 第二,规则透明。 因为智能合约在所有节点上都是同一个虚拟机和代码,运行相同输入的结果一定是相同的,这是可验证的。 第三,可追溯性。 由于每个人都有所有的数据,数据包括区块0到区块的最新高度,这意味着它是可以追溯的。 因为以上几点,实现了区块链最重要的特性——信任。 然而,任何事情都有两个方面。 说到区块链上的隐私挑战,首先定义什么是隐私? 您的个人数据和信息是隐私:除了您拥有多少资产、银行存款、房产等,还包括您与谁进行交易,即银行流水。

比特币策略软件_比特币的隐私保护策略_比特币分叉对比特币的影响

在递交出国签证申请之前,我需要附上最近六个月的银行对账单和纳税记录。 当时,我很惊讶,也很难接受。 我觉得这些交易关系是我的私人数据。 从流水中的交易信息,可以分析出交易时间、地点、交易对象,以及常用的交易类型是散户还是转账。 这些是你的行为模式。 现在所谓的大数据营销,更多的是根据你的身份、资产、交易关系、交易频率、行为模式等信息,对你进行用户画像,分析你的习惯和喜好。 还有就是大容量的数据文件,在业务场景中比较常见。 比如刷脸会留下视频,签合同会留下PDF文件,大量的用户行为会产生一堆大数据集,这些数据实际上是隐私的、个人的、商业的数据。 因此,隐私是三维的,它包含很多维度,各种场景、时间、行为都会产生隐私数据。

区块链上隐私保护的实现 区块链上的隐私是如何体现的? 过去大家都说比特币和以太坊本质上是隐私的,但他们隐私基础的重点是匿名性。 比特币和以太坊上的转账使用的是私钥和私钥生成的地址,其中不包含用户的联系电话、真实姓名、邮箱地址等个人信息,大家看到的是一串密码。 比特币网络的创造者中本聪仍然不为人知。 听起来这是一个非常成功的隐私保护方案。 但是,如果你不注意私钥的保管,或者自己在某个论坛上公布地址,让别人给你转账,就意味着地址绑定了你在论坛上的账号。 如果您参与某种交易所,您需要注册您的个人手机号并上传您的身份证以登录交易所。 此时,您的地址与您的身份绑定; 或者你可以使用反洗钱和反恐怖融资策略——简而言之,你可以使用一些方法,将账户与你的个人身份相关联。

比特币的隐私保护策略_比特币分叉对比特币的影响_比特币策略软件

从技术手段来看,IP映射就是不管你在哪台电脑上,发送哪个通讯包,只要能抓到包,你就可以解析出包中的很多信息,映射到你的电脑上获取您的帐号、地址等。社会工程分析还可以根据您在论坛上的行为、个人友谊和转移帐户的交易关系进行跟踪。 如上图所示,只要转了钱,就有了关系网,是公开可追溯的。

比特币分叉对比特币的影响_比特币策略软件_比特币的隐私保护策略

区块链的特点是透明、共享、可追溯、广泛参与:因此,区块链实际上带来了更大的隐私挑战。 有一种说法,区块链大量使用了密码学,因此是可信的、可验证的。 为了实现信任和验证,需要引入更多的密码算法。

比特币策略软件_比特币的隐私保护策略_比特币分叉对比特币的影响

在工作中,我们会遇到很多心灵拷问:作为一家金融机构比特币的隐私保护策略,日常交易信息是否透明? 如何让链上数据可验证而不被看到或被盗? 数据上链后,是否可以删除? 加密数据能否被暴力破解? 椭圆曲线、RSA 算法、对称和非对称加密现在用于保护具有非常长密钥的数据。 在数学理论中,这些都可以保证数据的安全,但是量子计算完成后我们该怎么办呢? ……我个人认为,量子计算技术可能还不够成熟,无法如此迅速地应用。 目前,量子计算的形式可以交换密钥,但在处理和解密大量数据方面还是比较困难的。 但是对于金融行业来说,如果数据保存20到30年,甚至永久保存,即使用长密钥加密,链上数据也有可能被破解。 父亲数据被破解,影响儿子,影响几代人,(这种现象)理论上是存在的。

比特币分叉对比特币的影响_比特币的隐私保护策略_比特币策略软件

当然,密码学保护和攻击的两大阵营是交叉盘旋的:你有矛,我有盾。 这只是取决于哪个更强,是矛还是盾,以及保护数据的成本是多少。

隐私保护在实际场景中的应用 典型金融场景一:风险控制 假设一项借贷服务涉及多家机构参与,这些机构共同为借款人提供资质证明和资金,这意味着这些机构要投票判断用户信用,确定贷款利率等。但是,金融需要独立的风险控制,即机构a和机构b的规则应该相互独立,独立运作。 如果只有一套规则并且所有规则都是透明的,人们可能会猜到。 这也涉及到用户隐私问题。 例如,a机构用户的交易数据不应直接交给b机构。 机构a和机构b都应该用自己的数据和数据来判断用户。 这些是隐私保护。

比特币的隐私保护策略_比特币策略软件_比特币分叉对比特币的影响

征信与风控有相似之处,但不同的是,征信需要使用大量多维度的有效数据,涉及社保、银行、税务等部门的参与。 如何将不同维度、不同机构的数据连接在一起,梳理出风控模型,这自然就和联邦学习联系在一起了。

比特币策略软件_比特币的隐私保护策略_比特币分叉对比特币的影响

典型金融场景2:资产转移 下图左侧的场景类似于二级市场:有发行和代销,机构A不想让机构B知道自己的代理状态,用户也不想其他人知道他们在买卖。 这些都是个人账户资产的变化,属于隐私信息。

比特币分叉对比特币的影响_比特币的隐私保护策略_比特币策略软件

哪个隐私政策更好? 现在确实有很多隐私保护策略,比如零知识证明、安全多方计算、可信硬件环境、全同态密文计算等,以及相关的规范和标准,能不能完全保护隐私呢? 我的观点是,每一种隐私保护策略都有自己的优势和劣势,其优势和劣势可能体现在性能、功能、复杂性和中心化等方面。

比特币分叉对比特币的影响_比特币策略软件_比特币的隐私保护策略

零知识证明和安全多方计算是隐私保护的核武器,潜力巨大。 但它也有局限性。 例如,零知识证明的重点是证明一个事物的有效性,而不是计算,但用户的账户和风控模型都涉及到计算。 安全多方计算可用于联合计算,但目前处于从两方向多方发展的阶段。 多方安全解决难度大,涉及成本、计算量、复杂度。 我们都知道手机有安全区,把密钥保护在安全区可以降低安全风险——但是一个大企业把成千上万的数据保护在安全区,相当于完全依赖安全区。 安全软硬件仍存在漏洞,仍需及时升级。 一般来说,依赖硬件系统的响应速度会比较慢。 同态非常有趣。 两个密文相加得到一个密文。 密文解密后就是两个密文对应的明文相加的结果。 它可以在很多情况下用于账户计算,但只能计算,难以验证,即如果计算结果有误,在密文情况下无法获知。 而且同态一般用于加法计算,乘法计算比较慢。 另外,如果同态数据量比较大,数据的膨胀和计算速度的降低会非常明显。 群/环签名,很轻,性能也不错,但是主要是面向身份的,不是面向数据的。 规范和标准依赖于许多链下管理方法,例如惩罚和司法问责。 我们需要将所有这些手段结合起来,在性能、功能、复杂度和集中度之间取得平衡,在不同的场景中取长补短,达到成本和效果的最优。 那么需要从多个维度考虑隐私保护,这是一个三维场景问题。

比特币分叉对比特币的影响_比特币策略软件_比特币的隐私保护策略

身份、资产、交易,这些是我们要保护的基本信息。 首先,这些信息是否可见? 如果你连数据都不能碰,你就不能对数据做任何事情。 其次,我们能看到之后,能不能用? 如果你看到的是一串密文,那是不能用的。 您还可以使用混淆和脱敏的方法来确保信息不完整。 比如有账号信息,但是没有身份信息,就无法被利用。 例如,密码学有一个密码信封,只有拥有信封钥匙的人才能打开。 或者使用一次性一密化名等多种方式来防止关联,使用户无法被画像,外人只能看到孤立的数据,无法对用户做任何事情。 最后,就是你看到的数据能不能控制。 控制数据是指如果你把我的账号转给他人,改变我的属性,我会做权限控制,安全策略进行安全加密,多方制衡。 上面说了,区块链有一个特点:你改数据,别人不同意,共识算法失效,我有拜占庭容错,就是多方制衡。 我们想达到几个效果:数据是不可见的、未知的、不可更改的,但在区块链上仍然是可验证和可监督的。 这就是联盟链的特点——必须规范、合法、合规,这些要求必须覆盖链的整个生命周期,包括收集、传输、存储、使用、屏蔽、销毁。 生命周期的每个阶段都有不同的特点,所处环境也涉及到网络、存储、内存计算、云等,需要采用不同的技术手段来应对。 所以,我们整个地图还是很复杂的。 地图的底层是各种隐私技术,不是一两种算法、密码承诺或简单的无意传输就能覆盖的。

以可见、可用、可控的思维看区块链

比特币的隐私保护策略_比特币策略软件_比特币分叉对比特币的影响

联盟链和公有链最大的区别在于联盟链有准入机制。 所有接入联盟链的人、机构、节点、身份都是已知的,需要向运营委员会申请后才能接入。 委员会是多中心化的,而不是一个单一的点。 如果每个人都同意你加入这条链,并给你分配了证书和公私钥,你就可以访问这条链。 方式是发起连接。 如果这个人或者节点在链上有恶意行为,委员会也可以把他踢掉。

比特币的隐私保护策略_比特币分叉对比特币的影响_比特币策略软件

一个隔离组织在参与业务时,可能会与不同的人发生交易。 作为一个组织,它希望这些人不要重叠,这样就不会发生同行之间的竞争和数据泄露。 我们开发的底层平台有一个group结构,就是在区块链上拉出一个部分共识的独立账本。 群内信息相互隔离,群内可以扩展,即可以创建无数个群,覆盖无数个业务,在性能和功能上都有很大的好处。 不同群组、不同链中的不同信息需要相互验证和通信,走跨链路径。 该技术在安全性方面是可控的。

比特币的隐私保护策略_比特币分叉对比特币的影响_比特币策略软件

首先要明确角色隔离,不同的人做不同的事情。 有个名词叫DO分离,就是开发和运维的分离。 开发不能做运维,运维不需要写代码。 为了扩展,将建设、管理、使用分开,避免一个角色既是裁判又是运动员,以免触及过多数据,侵犯隐私。 这就是整个联盟链的角色分层概念。

比特币分叉对比特币的影响_比特币的隐私保护策略_比特币策略软件

刚才讲了节点、人、权限的隔离,再看数据隔离。 我经常被问到一个问题:我可以上传一个文件到链上并分享,同时又不让所有人看到这个文件吗? 这个时候就可以把文件加密上链了。 还有一种方法是文件不需要上传到链上。 链上存储了一些标识符或者URL,是一些哈希值,相当于文件的指纹。 通过链上链下结合:链上建立哈希指纹,链下传输文件,用户可以在链上获取指纹验证文件。 如果文件的保密级别不高,可以用IFPS,但是它把文件分成了碎片,你还是可以和几台电脑合谋,把文件碎片凑在一起拼出文件。 如果安全级别高,建议使用自己的存储。

比特币的隐私保护策略_比特币策略软件_比特币分叉对比特币的影响

事务隔离。 链下的一些隐私交易是高频的、小额的、点对点的。 它们可以放在链下,就像闪电网络是类似的风格。 这个操作一方面可以提高性能和响应速度,更重要的是可以解决事务关系的问题。 区块链上的两个人通过点对点网络进行通信,而无需通过服务器。 因此点对点过程是完全私密的,但最终产生的是账户,而这个点对点交易的私密信息是不计入总账的。

比特币分叉对比特币的影响_比特币策略软件_比特币的隐私保护策略

分布式身份识别协议(DID Protocol) 该协议由DIF(全球分布式身份基金会)和W3C(万维网联盟)国际标准化组织共同推动。 无缝共享和流通。 这个模型可以连接人、物联网和数据,服务于金融、政务、医疗等各种场景。 它是一个非常开放和通用的标准,参与其中的用户可以自己控制和拥有数据,这与以往的许多互联网模式不同。 在互联网模式中,互联网巨头把我们所说的所有数据都存储在“云”上,(实际上)在别人的机房里。 用户只有一个登录密码,无权管理或拥有数据。 这是非常重要的一点:用户保存和控制自己的数据。 这些数据是一种凭证,来自权威机构或用户商业行为。 它们不仅仅是数据,而且是证据、可信和可验证的。 证明。

比特币分叉对比特币的影响_比特币策略软件_比特币的隐私保护策略

如何理解分布式DID协议? 首先用户需要做KYC,比如刷脸,要求KYC生成logo。 全局唯一标识符,看起来像密码字符串。 中间竖线左边的一切都是用户拥有和控制的,右边是你要交出的,中间起到了防火墙的作用。

比特币的隐私保护策略_比特币策略软件_比特币分叉对比特币的影响

这里有一个隔离。 谁向你要什么数据,就必须注明访问政策,就像你的安卓手机安装app时,要求你开启相机权限,即用户同意访问政策,才给出表达或披露。 此披露是可验证的,但它是选择性的最小披露。

比特币策略软件_比特币分叉对比特币的影响_比特币的隐私保护策略

这是一种非常重要的隐私保护模式:你保存和管理自己的数据,明确同意,通过审核后,选择一些数据,从中生成密文证书,交给对方进行认证。 因为区块链连接了当局、用户和商户,链上可信验证是区块链和隐私保护的有机结合。 企业数据涉及大量关于人、行为和业务的数据。 如果要联合做生意,会考虑使用联邦学习,这样多个机构的数据不能导出到自己机构,也可以训练出有效的模型。 这个模型可以导入到区块链中,链上的行为、风控、交易汇率、信用评级、定价等,都可以使用联邦学习训练出来的模型,非常有意义。

比特币分叉对比特币的影响_比特币的隐私保护策略_比特币策略软件

不同的目标需要使用不同的算法,比如收集大量数据,做差分隐私; 化名以防止肖像; 数据脱敏后同态加密,聚合到云端。 这些是大规模群数据算法,适用于大数据挖掘和联邦学习。

比特币策略软件_比特币分叉对比特币的影响_比特币的隐私保护策略

再来看看身份隐藏,适用于匿名支付、匿名投票、匿名拍卖等场景。 如果能做到匿名和监督,用户就不用担心自己的投票行为会被别人批评。

比特币的隐私保护策略_比特币策略软件_比特币分叉对比特币的影响

数据是保密的,资产中的数字和交易行为都是数据。 支付、投票、投标,这些都是场景。 可能会用到同态加密、零知识证明、安全多方计算、TEE等技术。 这一系列的技术如何应用​​到业务中? 前面说到隐私保护策略、数据维度、算法这么多,不可能每一种技术都用在一个场景,所以我们把这一套技术集成成一个开发包方案,从业务层,服务层覆盖,区块链以智能合约的整体架构,不同的客户端使用不同的密钥,通过SDK和模板工具生成场景所需的隐私保护项目和策略。

比特币分叉对比特币的影响_比特币的隐私保护策略_比特币策略软件

值得一提的是,每个人的隐私偏好不同,但我们以最严格的隐私保护标准来做,这样对整个生态的未来都是健康的。 我们的技术也是开放的,包括区块链,大部分都是开源好用的,可以适配很多场景。

综上所述:隐私保护,机遇与挑战并存。 隐私保护是一个三维策略。 设计一个通用的隐私保护策略其实是很难的。 我们现在做的是针对大量的场景有效的实现它。 也欢迎大家共同学习实践,实现技术、商业、整个生态价值的突破。

比特币策略软件_比特币分叉对比特币的影响_比特币的隐私保护策略

比特币的隐私保护策略_比特币分叉对比特币的影响_比特币策略软件