联邦学习,目前最受到了工业界和学术界广泛关注,作为数字经济的新基建核心科技,结合隐私计算、区块链等技术共同赋能于数字经济时代的数据安全共享和“可用不可见”。
宣传Google首次提出了联邦学习应该打上个问号。公开资料表明,我国学者远早于google提出了联邦学习。
谷歌于2017年才在官方博客中发文,提出了联邦学习,该技术实际上是一种加密的分布式机器学习技术,各个参与方可在不披露底层数据和其加密形态的前提下共建模型 [1]。论文[1]往往被宣传为Google首次提出联邦学习的证明,公开学术资料表明我国学者早于Google4年提出联邦学习并应用于医疗在线学习。
我国学者于2012年首先提出了联邦学习框架应用于医疗在线学习,并于2013年发表在了专业SCI期刊上,论文题目是EXpectation Propagation LOgistic REgRession (EXPLORER): Distributed privacy-preserving online model learning[2]。该论文提出了在不需要分享原始个体数据的情况下,利用多个数据源进行带有隐私保护的联合建模。同年该团队发表了开源联邦学习框架“WebGLORE: a web service for Grid LOgistic Regression”,该底层技术服务于多个医疗网络数据的联邦建模需求。团队并于2017年前又发表了十余篇联邦学习相关著作。该团队为国家级引进人才王爽教授团队,王爽教授目前还担任四川大学华西医院特聘研究员、同济大学附属普陀医院客座教授、杭州锘崴科技CTO。iDASH全球隐私计算大赛创始人。
此外,香港科技大学新明工程学讲席教授 、计算机科学和工程学系主任杨强团队2017年提出了“Distant Domain迁移学习”的理论体系 [4] 。此外,为了解决数据割裂、数据孤岛问题,于2018年提出并于2020发表了安全联邦迁移学习论文,结合了联邦学习和迁移学习【5】。在杨强的带领下,微众银行AI 团队开源了FATE。
[1] McMahan HB, et al. Communication-efficient learning of deep networks from decentralized data, ICAI, 2017
[2] WANG Shuang, et al. EXpectation Propagation LOgistic REgRession (EXPLORER): distributed privacy-preserving online model learning. J Biomed Inform. 2013
[3] Jiang et al. WebGLORE: a web service for Grid LOgistic Regression, Bioinformatics, 2013
[4] TAN Ben, et al. Distant Domain Transfer Learning,Proceedings of the Thirty-First AAAI Conference on Artificial Intelligence (AAAI-17),2017
[5] LIU Yang, et al. Secure Federated Transfer Learning. arXiv:1812.03337, 2020.