数据空间
您当前的位置: 首页 /新闻资讯

释放数据能的三个阶段

发布时间:[2020-08-14] 来源:中关村网金院 点击量:

       6月29日,2020第四届金融科技与金融安全国际云峰会暨2020中关村“番钛客”金融科技国际创新大赛启动仪式在线上召开,会议中提到目前,实现数据的可流通、可定价、可交易,需要由信息共享模式转变为实现数据可用不可见的新数据使用模式。这一过程可分为三个阶段:一是保证数据按用途用量使用;二是借助TEE、数据脱敏、差分隐私、多方安全计算等技术;三是实现数据真正的生产要素化,对每次使用的每个数据进行精准定价,促进数据价值流通。

      金融业数字化转型已经谈了很多年了,今天我想根据近期的研究成果跟大家谈一下“数据能”,希望给大家带来一些新的启发。
      去年,中国互联网金融协会组织走访调研了51家银行机构,对银行业数字化转型现状有了一个整体的把握。各参与调研的金融机构在五分制下平均得分是3.01分,折合成百分制的话,正好是60.2分,是一个刚刚及格的成绩。
      我们看一下具体的情况:战略规划,也就是思想重视层面,是得分最高的,其次是资金投入,再次是数据治理,但是数据治理是低于平均线的,最后是技术创新。技术创新得分底大家是比较容易理解的,因为对于一个大银行来讲,当它做核心系统升级的时候,可能需要几千人的人力投入,但是一旦系统升级之后,几千人怎么摆可能是一个问题,而对于小的银行来讲,自己聘用高端信息科技人才,也是一个很大的投入。
      为什么数据治理谈了这么多年,其水平还在平均线以下呢?我们来看下具体的情况。大银行不管自己做成多大,始终还是一个数据的孤岛。为什么这么说呢?近两天大家都在转的一篇文章,说有可能给银行机构发一个证券的牌照,但是一旦发了证券牌照的话,他们能够混用的是什么呢?人员不能混用,业务也不能混用,资金池也不能混用,最有混用价值的就是数据。然而,从目前对数据的管理办法来讲,即使在同一个集团内,不同的主体之间数据依然是不能混用的。对于小的银行来讲,都不是数据孤岛的问题,因为它的数据甚至还没有形成一个岛。小银行面临的挑战是如何逾越“数字鸿沟”,所谓的数字鸿沟,就是信息化技术使用得越少,离现在的先进水平差距就会越大,这个鸿沟会逐渐被拉大。对于监管机构来讲会有同样的困惑;如何加强事中监控和管理,目前没有一个既能达到实时效果,又能不增加新的数据旁路风险的两全手段。
      刚才提到的问题都集中在数据治理上,有没有可能让数据治理突破当前的瓶颈呢?我们之前一直实现数据能够跨信任域使用的手段是“信息共享”,要先把数据拿出来,给到其他方,才能实现对这个数据的共享使用。那站在第一性的原理上考虑这个问题,我们会有一个“假想”,有没有可能实现数据不拿出来,而只是把数据的能量传递出来给到其他人用呢?换言之,数据能否做到可用而不可见?
 11.jpg
       上面的“假想”能实现吗?让我们从一道加法题看起,这个题很有意思,甲的数字是30,乙的是80,我们想得到两个数字的和,以前经典的做法是,要不把甲的数据给乙,要不把乙的数据给甲,要不全给到第三方,但是甲或/和乙的数据就暴露了。现在,我们可以把甲和乙的数据随机分成两个数,分别给到丙和丁,这样丙和丁就只拿到了数据的碎片,而不知道数据到底是什么。丙和丁分别计算碎片的和,再把两者的和加起来,就得到了我们想要的答案。同样用这个方法我们可以做减法、乘法和除法计算。我们知道,所有的函数都可以转化成四则运算。比如,比较复杂的Sigmoid函数也可以用四则运算来做。我们从一道加法题的新做法可以看出来,让数据可用不可见通过技术的方法是可以实现的。当然,我提到的办法只是实现“数据可用不可见”方法中的一种。
       去年和今年我们听到一个新词“数据生产要素化”。这是一个很重要的举措,为我国未来的数字经济拉开了宏伟的序幕,也将推动各领域的数字化转型走上快速发展的道路。我们来看看这些具体的要求,比如:数据等生产要素的贡献由市场评价,按贡献决定报酬的机制,并且完善数据权属界定,开放数据交易流通等共享措施。其实这些要求都是要让数据这个特殊的生产要素,能够像以往的土地、人才、知识等生产要素一样,可定价、可流通、可交易。而要让数据可流通、可定价、可交易,一个最核心的转变,就是要让数据可以“可用不可见”,并且能够按照规定用途和用量进行使用。
12.jpg 
      我认为数据可用不可见,按规定的用途用量使用,是我们当前面临的黄龙第一关。那么黄龙第二关是支撑这个目标的技术,目前来看经常提到的技术有数据脱敏、差分隐私、可信计算环境(TEE)、联邦学习、多方安全计算等。联邦学习是把各方数据联合起来进行建模,但不把所有数据堆积在一起。检验的标准,是所有的数堆积在一起训练出来的模型,和通过联邦学习得出来的模型进行比较,之间的差值小于一个我们能够接受的差值就可以了。多方安全计算的定义是说F(X,Y)=Z,在得出Z的过程中,X、Y是各方都不能够反推出来的。但是这个只是黄龙第二关。
      就像5G、大数据、人工智能一样,大家对核心的技术并不会如数家珍,只要知道各种技术的组合能够产生的效果就可以了。其实在整个过程中,各种技术因地制宜地混合运用,才能实现隐私保护、效率与成本的最佳平衡。在这种情况下,我们就能实现黄龙的第三关,即数据真正的生产要素化--每一次使用一个数据我们都可以根据他的使用用途、使用用量进行精准定价,通过交易促成它的流通,在这个过程中,我们传统利用数据的方式,就进化为使用“数据能”的方式。
      最好的预测未来的方法是创造未来。我希望今天用短短的时间给大家谈到的一个小小的点,能够启发大家的思考,给大家带来一个在解决金融业数字化转型过程中的有效的武器。谢谢大家。
 

发表评论 共有条评论
用户名: 密码:
匿名发表