导语:知识和数据被视为驱动人工智能迈向3.0时代的重要要素。如何把分散在不同的行业或领域里的数据和知识,充分地利用起来?同盾科技人工智能研究院创造性地提出了数据安全交换(FLEX)协议,该协议约定了联邦过程中参与方之间数据交换顺序,以及在交换前后采用的数据加解密方法。其中包含一系列的约定,只要遵守这些约定,参与方就可以安全地加入到联邦中,无需担心数据隐私会有泄漏风险,全面实现数据可用不可见,为人工智能3.0时代奠定重要的基础。
AI3.0的轮廓已依稀可见
同盾科技合伙人、人工智能研究院院长李晓林教授以历史的眼光把人工智能的发展分为三个阶段,他认为大约每隔30年,人工智能将会迎来一次革命性跃迁。当下,我们正处在人工智能2.0时代。
人类学习依靠人的大脑,是小数据学习的模式,而人工智能的机器学习、联邦学习都离不开大数据。算法、算力和数据被普遍视为人工智能发展的三要素。人工智能2.0时代,大数据是人工智能发挥重要作用的引擎,但目前数据智能所面临的挑战也近在眼前,数据孤岛、数据安全交换等成为制约AI技术应用的瓶颈,也是AI始终无法突破超越人类智能的那个“奇点”。
我们是否会被困在人工智能2.0时代,何时将迎来3.0时代?李晓林教授认为,当人工智能步入3.0时代,除数据、算力、算法三要素之外,知识要素将成为第四要素。基于新的四要素,AI3.0会建立一个全面反映人类智能的、可解释、可因果推测、可共享的泛在生态,优化用小数据和点滴知识去实现全面认知和推理的能力,并且能够做出更加复杂、自主化的智能决策。
如何把分散在不同的行业或领域里的知识,充分地利用起来?同盾人工智能研究院知识联邦技术体系中的数据安全交换协议应运而生。
或将改变游戏规则 数据安全交换协议是什么?
我们知道,以万维网和HTTP协议的出现为标志,信息革命被迅速引爆,与其说是一种技术,倒不如说它是对信息的存储和获取进行组织的一种思维方式。
数据安全交换协议同样是一种组织和思维方面的革命,不同的是,这是发生在人工智能领域。
联邦表面上看只是将不同的参与方连接起来,作为一个整体共同参与联邦应用,但实际上它并不是简单地连接和通信。除了连通之外,联邦还要保证在交互过程中不会泄漏参与方的数据隐私。所以,联邦的本质是多个参与方之间的数据在时空中的安全交换,并由此产生价值在时空中的实现和交换。
目前为止还没有一种数据安全交换标准形成,能让各方确保数据交换过程的安全性是有保障的,进而愿意加入到联邦中。一旦参与机构(数据提供者)足够多,联邦规模足够大,数据多样性就有保障,也就会有更多机构(数据使用者)愿意来使用联邦服务,也会有更多科技型机构(模型和应用开发者)来提供丰富的算法、模型和应用。
从图中展现的联邦生态构建过程可知,数据安全交换是整个联邦生态的核心。为了保证联邦生态的顺利建设和良性发展,业界亟需一套统一的数据安全交换标准,支持各种联邦应用落地。
基于此,同盾科技人工智能研究院提出了联邦数据安全交换(Federated Learning EXchange,FLEX)协议。FLEX协议约定了联邦过程中参与方之间数据交换顺序,以及在交换前后采用的数据加解密方法。只要参与各方能够遵守这些约定,就可以安全地加入到联邦中提供数据或使用联邦服务,无需担心数据隐私会有泄漏风险。
FLEX协议实际上包括两层: 1) 应用协议:这一层协议是面向联邦算法的,为联邦算法提供多方数据交换的应用支撑。协议中会约定多方间数据交换的顺序和采用的具体密码算法。联邦过程中采用的通信协议也会被封装在这里。 2) 公共组件:是上层应用协议所依赖的基础密码算法和安全协议,比如同态加密、秘密分享等。
FLEX协议封装了数据安全交换的实现,共提供了5大类17个协议,并定义了与联邦算法相关步骤的接口,也就是参数的输入和输出。至于联邦算法中的其它非相关步骤,FLEX是不关心的。而联邦算法在执行中只在需要多方数据安全交换时才调用FLEX协议,提供输入参数并接收输出结果,无需关心FLEX内部是如何加解密和通信的,更不需要关心其它参与方是谁、其它数据存储在哪里等问题。
知识联邦重塑数据生产关系
未来的社会,数据是生产资料,人工智能是生产力, 知识联邦是生产关系。 目前,数据作为生产要素驱动了人工智能的发展,人工智能的突破是生产力的突破,它提供了一种提升效率的方法。而知识联邦则是一种新型生产关系,它能够改变我们使用数据的方式,实现数据等生产资料在时间和空间上的价值转换和交易。
联邦尤其适用于开展跨机构的数据资产协作,有助于促进不同主体之间的数据共享和优化业务流程。基于联邦技术,做大数据分析就不需要再收集获取数据,而是直接使用数据即可,数据所有权不会发生变化。数据的拥有者真正实现对数据的所有,最大化数据在多种场景下的多次价值实现,其它机构都是按照联邦协议使用数据。与过去相比,数据资源的所有权变了,相当于生产关系中的一个重要要素也就改变了。
联邦提供了一种数据安全的分布式计算环境,使数据不用集中到一家机构,也能实现智能计算和分析,降低数据共享阻力和合规风险。可以说,联邦的应用有望扭转当下数据日益集中化的趋势,避免中心化垄断,重新平衡各方利益。也会进一步推动数字经济向开放共享的方向发展,从而彻底重塑数据的“生产关系”,开创数字经济时代的新模式。