3 月 19 日,机器之心联合微众银行开设的公开课《联邦学习 FATE 入门与应用实战》 第四讲结课,VMware CTO 办公室资深研究员彭麟为大家介绍了使用 KubeFATE 部署生产环境的联邦学习 Kubernetes 集群。第四讲回顾视频:
下周,我们将迎来本系列公开课的第 5 讲和第 6 讲,详情如下:
公开课第5讲(附项目实践)
课程主题:FATE 整体架构介绍与系统实践
课程时间:3 月 24 日 20:00 主题演讲 项目实践 在线答疑
课程讲师:曾纪策 微众银行人工智能部系统架构师
讲师简介:联邦学习开源项目 FATE 工程研发负责人,曾主导业界领先的智能运维感知平台,推动人工智能在 Ops 领域的落地,加入微众前,在百度负责大规模流量分析调度系统,运维大数据平台等项目,在机器学习、大数据数据处理方面有丰富的实践经验。
课程摘要:FATE 作为一个面向生产环境的联邦学习框架,在系统架构方面,FATE 支持灵活的算法流、高弹性作业调度、分布式存储、高性能计算、跨站点传输以及高性能在线推理,包含了机器学习生命周期中诸如数据处理、模型训练、模型管理、在线推理等绝大部分功能。本次课程将介绍 FATE 整体架构、系统关键数据流以及如何实践
实践内容:
- FATE 整体架构介绍
- 端到端的联邦学习 Pipeline 介绍与实现
- 高可用高性能联邦学习在线推理服务
- 完整的机器学习生命周期实践
课前准备:
- python2.7 环境
- fate 代码
- 可运行的 fate 环境,不限制版本,Standalone、Cluster 等版本均可
- 实践部分会涉及一般命名操作
公开课第6讲
课程主题:联邦推荐算法及其应用
课程时间:3 月 26 日 20:00 主题讲解 在线答疑
课程讲师:谭奔 微众银行人工智能部高级研究员
讲师简介:博士毕业于香港科技大学,主要研究方向为迁移学习、推荐系统、机器学习等,目前在微众银行人工智能部门负责推荐算法研发工作,曾就职于腾讯,负责广告转化率预估、商品推荐等工作。在 KDD、AAAI、SDM、TIST 等国际学术期刊会议上发表论文 10 余篇,多次在国际数据挖掘大赛中名列前茅。
课程摘要:课程主要介绍联邦推荐系统背景、联邦推荐系统分类以及现有工作、联邦推荐算法实现和联邦推荐在新闻推荐的应用。
第3课精选问答
在每期课程的 QA 环节中,有一些问题被广泛提到并且很有价值,所以我们进行了精选与编辑,供大家参考。以下为第 3 课问答精选(第 2 课主题为联邦学习 FATE 算法模块梳理及建模演示):
Q:请问稀疏数据 input 都有哪些?
我们现在主要支持的是两种,tag 和 tag:value,比如说我这个人是不是有车、有房、是男是女等等,tag:value 就是说比如说年龄:40,身高:1.6 米等等。
Q:union 是做什么?针对横向联邦吗?
不是,union 是一个单边的组件,它只是把两个组件输出的数据合并起来而已,就只干这一个事情。
Q:预测的结果在哪里看?仅 guest 方持有吗?
对,只有 guest 方持有,在纵向联邦当中是这样的。对于横向联邦,每一方都有自己的模型,一般来讲在横向的模块当中是不需要加密的,但是横向 lr 我们是提供了对 host 加密的模型计算方法。这种情况下,Host 方是拿不到这个模型的。
Q:预处理及特征工程可以介绍一下么?
目前 FATE 实现的特征工程组件包括采样、联邦特征分箱,联邦特征选择、特征归一化、onehot 编码等等。具体的内容,在 github 上有详细的文档介绍:https://github.com/FederatedAI/FATE/tree/master/federatedml/feature
Q:如何对数据质量进行评估?
在建模的时候,FATE 提供了一个 local_base 的组件,可以使用本地的数据建模,从而和联邦以后的建模效果进行比对。除此以外,还可以看看交集的数量,求对方特征的 iv 值进行比较等等方式。
Q:如果没有同态加密的,联邦和分布式有什么区别?
这个区别还是挺大的。分布式是你自己的的集群,你自己可以随便访问数据,但联邦学习即使没有用到同态加密,比如说只用了安全聚合的方式,你也是 access 不到别人的数据的,对于 arbiter 来说,只能得到最终所有模型聚合的和。
第 4 课的问答精选正在整理中,详情请关注公开课专栏更新,点击阅读原文即可跳转。
如何加入
添加机器之心小助手(syncedai6),备注FATE,加入《联邦学习FATE入门与应用实战》课程学习。主题讲解、项目实践、在线答疑,联邦学习从零入门。
,