联邦学习概述

本博客地址:https://security.blog.csdn.net/article/details/122779883

一、联邦学习的定义与应用场景

联邦学习是从技术维度出发,重点研究其中的隐私保护和数据安全问题的一种技术。其旨在建立一个基于分布数据集的联邦学习模型。

对于联邦学习的过程,主要分为两部分:

● 模型训练。在模型训练阶段,模型相关的信息可以在各方之间交换(或者是以加密形式进行交换),但数据不能交换,因此各个站点上的数据将受到保护,训练好的联邦学习模型可以置于联邦学习系统的各参与方,也可以在多方之间共享;
● 模型推理。在模型推理阶段,模型可应用于新的数据实例,由各参与方协作进行预测,最终,通过公平的价值分配机制来分配协同模型所获得的收益,通过这种激励机制,从而使得联邦学习过程能够持续。

具体来讲,联邦学习用来建立的机器学习模型的算法框架具有以下特征:

● 有两个或以上的联邦学习参与方协作构建一个共享的机器学习模型。每一个参与方都拥有若干能够用来训练模型的训练数据;
● 在联邦学习模型的训练过程中,每一个参与方拥有的数据都不会离开该参与方,即数据不离开数据拥有者;
● 联邦学习模型相关的信息能够以加密方式在各方之间进行传输和交换,并且需要保证任何一个参与方都不能推测出其他方的原始数据;
● 联邦学习模型的性能要能够充分逼近理想模型(是指通过将所有训练数据集中在一起并训练获得的机器学习模型)的性能。

对于实际应用来说,联邦学习的应用一般有两种场景:

● 一种是应用于B2C场景,在此场景下,联邦学习能够通过支持边缘计算,让云系统的终端设备处理许多计算任务,从而减少通过原始数据与中央服务器通信的需要,具有代表性的应用如Google的Gboard;
● 另一种是应用于B2B场景,在此场景下,多个企业可以联合起来搭建一个共享的机器学习模型,该模型是在确保没有本地数据离开任何站点的同时构建的,而模型性能可以根据业务需求进行一定程度的定制,具有代表性的应用如微众银行的FATE。

二、联邦学习的核心思想

一般而言,训练人工智能应用模型所需要的数据量都是非常庞大的。然而在实际上,能满足这样规模的数据量是难以甚至无法达到的。同时,由于法律合规、数据掌控权等各方面原因造成的数据孤岛,正阻碍着训练人工智能模型所必需的大数据的使用,所以人们开始寻求一种方法,不必将所有数据集中到一个中心存储点就能够训练机器学习模型。

一种可行的方法是由每一个拥有数据源的组织训练一个模型,之后让各个组织在各自的模型上彼此交流沟通,最终通过模型聚合得到一个全局模型。为了确保用户隐私和数据安全,各组织间交换模型信息的过程将会被精心地设计,使得没有组织能够猜测到其他任何组织的隐私数据内容。同时,当构建全局模型时,各数据源仿佛已被整合在一起,这便是联邦机器学习或者简称为联邦学习的核心思想。

但联邦学习同样也面临一些问题:

● 首先是参与方和中央聚合服务器之间的通信链接可能是慢速并且不稳定的,因为同一时间可能有非常多的参与方在通信。
● 另外,在联邦学习系统中,来自不同参与方的数据可能会导致出现非独立同分布的情况,并且不同的参与方可能有数量不均的训练数据样本,这可能导致联邦模型产生偏差,甚至会使联邦模型训练失败。
● 由于参与方在地理上通常是非常分散的,所以难以被认证身份,这使得联邦学习模型容易遭到恶意攻击,即只要有一个或者更多的参与方发送破坏性的模型更新信息,就会使得联邦模型的可用性降低,甚至损害整个联邦学习系统或者模型性能。

三、联邦学习分类

3.1、横向联邦学习

横向联邦学习适用于联邦学习的参与方的数据有重叠的数据特征,即数据特征在参与方之间是对齐的,但是参与方拥有的数据样本是不同的。它类似于在表格视图中将数据水平划分的情况。因此,我们也将横向联邦学习称为按样本划分的联邦学习。

例如,当联邦学习的参与方是两家服务于不同区域市场的银行时,它们虽然可能只有很少的重叠客户,但是客户的数据可能因为相似的商业模式而有非常相似的特征空间。这意味着,这两家银行的用户的重叠部分较小,而数据特征的重叠部分较大,这两家银行就可以通过横向联邦学习来协同建立一个机器学习模型。

横向联邦学习示意图:
在这里插入图片描述

3.2、纵向联邦学习

与横向联邦学习不同,纵向联邦学习适用于联邦学习参与方的训练数据有重叠的数据样本,即参与方之间的数据样本是对齐的,但是在数据特征上有所不同。它类似于数据在表格视图中将数据垂直划分的情况。因此,我们也将纵向联邦学习命名为按特征划分的联邦学习。

例如,当两家公司(一家银行和一家电子商务公司)提供不同的服务,但在客户群体上有非常大的交集时,它们可以在各自的不同特征空间上协作,为各自得到一个更好的机器学习模型。换言之,用户上的重叠部分较大,而数据特征的重叠部分较小,则这两家公司可以协作地通过纵向联邦学习方式训练机器学习模型。

纵向联邦学习示意图:
在这里插入图片描述

3.3、联邦迁移学习

联邦迁移学习适用于参与方的数据样本和数据特征重叠都很少的情况。

例如,当联邦学习的参与方拥有的数据集在用户和数据特征上的重叠部分都比较小时,各参与方可以通过使用联邦迁移学习来协同地训练机器学习模型。

联邦迁移学习示意图:
在这里插入图片描述

四、联邦学习开源平台介绍

FATE:是由微众银行人工智能项目组发起的一个开源项目,该项目提供了一个安全的计算框架和联邦学习平台,以支持联邦人工智能生态的发展和运作。

TensorFlowFederated(TFF):是一个为联邦学习和其他计算方法在去中心化数据集上进行实验的开源框架。TFF让开发者能在自己的模型和数据上模拟实验现有的联邦学习算法,以及其他新颖的算法。

TensorFlow-Encrypted:是一个搭建于TensorFlow顶层的Python包,可以让研究人员和实践者使用面向隐私保护的机器学习方式进行实验。

coMind:是一个训练面向隐私保护联邦深度学习模型的开源平台。coMind的关键组件是联邦平均算法的实现,即在保护用户隐私和数据安全的前提下,协作地训练机器学习模型。

Horovod:由Uber创立,是一个深度学习的开源分布式训练框架。它基于开放的消息传输接口,并工作在著名的深度学习框架如TensorFlow和PyTorch的顶层。

OpenMined:提供了隐私保护的两种方法:联邦学习和差分隐私。OpenMined还进一步支持多方安全计算和同态加密方法,能够支持两种以上的安全计算方法。可用于搭建安全和扩展性的机器学习模型的联邦学习框架。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/1382158.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

基于Pytorch的深度学习激励函数总结

基于Pytorch的深度学习激励函数总结 1 激励函数定义2 常见激励函数2.1 Threshold函数2.1.1 数学定义2.1.2 常见性质2.1.3 Pytorch实现 2.2 Tanh函数2.2.1 数学定义2.2.2 常见性质2.2.3 Pytorch实现 2.3 Sigmoid函数2.3.1 数学定义2.3.2 常见性质2.3.3 Pytorch实现 2.4 ReLU函数…

机器学习、深度学习项目开发业务数据场景梳理汇总记录一

本文的主要作用是对历史项目开发过程中接触到的业务数据进行整体的汇总梳理,文章会随着项目的开发推进不断更新。 一、MSTAR雷达影像数据 MSTAR(Moving and Stationary Target Acquisition and Recognition)雷达影像数据集是一种常用的合成孔…

ps模糊照片变清晰步骤东方逐梦

ps把模糊照片变清晰步骤 1.打开照片双击解锁图层 2.CtelJ复制图层选择滤镜—>锐化—>USM锐化(按照以下步骤设置) 3.图像模式lab颜色合并图层 4.继续复制已经合并的图层进行一下操作 5.选中通道中明度继续SUM锐化半径选择1.2数量150%确定 6.回到原…

照片放大后怎么变清晰?

照片放大后怎么变清晰?在电脑使用的过程中,都避免不了需要将尺寸较小的照片进行放大处理,使用正常的方法将图片放大后(例如用ps将照片放大),照片的清晰度或多或少都会受到一些影响,画质变差失真…

【雕爷学编程】Arduino动手做(201)---行空板硬件控制之板载光线传感器

37款传感器与模块的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止37种的。鉴于本人手头积累了一些传感器和执行器模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的&#x…

Acrel-2000E/B配电室综合监控系统的应用

摘要:Acrel-2000E/B配电室综合监控系统是以智能控制为核心,通过物联网技术的集成应用,来实现配电室内环境的全天候状态监视和智能控制。针对经开第一大街南一所项目的要求,系统实现了环境数据监测和设备控制,起到了预防…

智头条:萤石拟科创板上市将投18.5亿建厂,Matter智能家居标准延迟至明年,涂鸦、公牛、极米等企业发布

  本栏目由智能产业专业媒体【智哪儿】出品。 1、行业 ① 萤石拟18.5亿建厂 将从海康威视分拆上市 8月10日,海康威视公告两项重磅消息,其一是分拆子公司萤石至科创板上市;其二是萤石将以自筹资金投18.50亿元&a…

既要便捷、安全+智能,也要颜值,萤石发布北斗星人脸锁DL30F和极光人脸视频锁Y3000FV

1. 视频、视觉人脸识别技术助推智能锁进入主动安全时代 智能锁经历了从电子密码、指纹、指静脉到人脸识别阶段,随着人脸识别技术的成熟,越来越多的主流厂商开始主推人脸识别智能门锁,与其他技术相比,人脸识别智能锁无疑从安全性和…

Web端接入萤石云平台的视频数据

前言 因为项目需要在Web和App上展示实时视频流信息,所以之前做项目时尝试了很多方法。有用vlc插件播放的(由于使用到了插件,所以安卓App、微信小程序都不能显示视频,最后也放弃了),也有使用海康威视Web开发包开发的。但是最简单的…

EasyCVR视频通道名称出现乱码是什么原因导致的?如何修复?

大家知道EasyCVR视频智能监控平台支持摄像机的RTSP、GB28181、和Ehome的接入,同时会对接入上来的视频信息进行同步的更新和反馈,因此视频通道的名称是实时更新的,当通道变化,名称也会随之重新生成。 在实际的使用过程中&#xff…

鸭蛋大小,灵巧设计,萤石全无线智能家居电池摄像机BC2上手体验

在智能家居场景中,安防一直是一个核心需求,无论是照看小孩、监看宠物、还是看家护院,智能家居摄像机有着无可替代的作用。但在实际运用场景中,往往因为传统摄像机安装布线麻烦、摄像机外型比较大等客观因素,将很多原本…

Web端与移动端接入萤石云平台的视频数据

前言 因为项目需要在Web和App上展示实时视频流信息,所以之前做项目时尝试了很多方法。有用vlc插件播放的(由于使用到了插件,所以安卓App、微信小程序都不能显示视频,最后也放弃了),也有使用海康威视Web开发包开发的。但是最简单的…

萤石春季发布会:4+N产品体系再升级EZVIZ Connect连接智能生活

3月18日,以“智家新生,萤领未来”为主题的萤石智能家居2022春季发布会在线上召开。本次发布会除了带来全无线电池摄像机、智能门铃、视频锁、玲珑面板、Wi-Fi6全屋覆盖方案等突破性创新产品外,还发布了新一代智能中控屏SP4,并通过…

html控制萤石云摄像头转动,怎么控制云台转动 ?

您好,目前萤石摄像机中只有C6系列(除C6P)、XP1、CP1、C8系列支持控制云台转动。您可以通过如下三种方式来控制设备云台转动: ◆ 方法一(萤石云视频APP): 1、登录萤石云视频手机APP,在“萤石”页签,点击摄像机的视频封面…

软工导论知识框架(七)面向对象设计

一.设计准则 分析:提取、整理用户需求,建立问题域精确模型。设计:转变需求为系统实现方案,建立求解域模型。 在实际的软件开发过程中分析和设计的界限是模糊的,分析和设计活动是一个多次反复迭代的过程。分析的结果可…

C++模板,STL(Standard Template Library)

这篇文章的主要内容是C中的函数模板、类模板、STL的介绍。 希望对C爱好者有所帮助,内容充实且干货,点赞收藏防止找不到! 再次感谢每个读者和正在学习编程的朋友莅临! 更多优质内容请点击移驾: C收录库:重生…

[Excel]Excel函数和用法(4)——查找字符串,SEARCH和FIND函数

区别:SEARCH大小写不敏感,FIND大小写敏感 作用:都是从左到右返回搜索到的字符串的起始位置 SEARCH语法:SEARCH(find_text, within_text, [start_num]) FIND语法:FIND(find_text, within_text, [start_num]) 如果指…

binary_search函数用法

STL之二分查找 (Binary search in STL) Section I 正确区分不同的查找算法count,find,binary_search,lower_bound,upper_bound,equal_range 本文是对Effective STL第45条的一个总结,阐述了各种查找算法的异同以及使用他们的时机。 首先可供查找的算法大致有count,f…

FIND函数嵌入INDEX和MATCH函数,简直就是万金油查找!!!

FIND函数大家通常是用来截取内容, 但是当你搭配到INDEX和MATCH,你会发现这个搭配非常巧妙,也非常强大. 这是一份销售表: 中间的品类繁多.名称都是细节型号. 需求: 现在这些品牌需要打折,折扣表如下: 难点: 上方是产品的型号详细描述,而我们需要给品牌打折. 例如: 第一行…