Gradient Sparsification for Communication-Efficient Distributed Optimization 阅读笔记

文章目录

摘要

现代大规模机器学习应用程序要求在分布式计算体系结构上实现随机优化算法，一个关键瓶颈是在不同worker之间交换信息（例如随机梯度）的通信开销。在本文中，为了降低通信成本，我们提出了一种凸优化公式，以最小化随机梯度的编码长度。关键思想是随机删除随机梯度向量的坐标，并适当地放大其余的坐标，以确保稀疏的梯度无偏。为了有效地解决最优稀疏性问题，提出了一种简单快速的近似解算法，并为稀疏性提供了理论上的保证。在实验阶段，我们使用了L2正则化逻辑回归，支持向量机和卷积神经网络的实验来验证稀疏化方法。

1 Introduction

大规模机器学习需要我们将随机优化算法扩展到分布式计算架构或多核系统中，在同步随机梯度算法中，每个worker利用本地数据训练模型得到更新梯度后将梯度广播给其他worker进行聚合更新全局模型，这个步骤需要重复多次知道模型实现收敛。在这个过程中，worker之间的通信问题会严重影响优化算法的速度。
在本篇论文中，我们提出一个新的算法，该算法通过稀疏化随机梯度以减少通信成本，而迭代次数只增加了一点点，该算法的核心思想是我们会随即丢弃随机梯度中的某些梯度，而对于其余的梯度我们会进行适当地缩放以保证无偏性。该稀疏化方式会大幅减少随机梯度的编码长度，并只会给随机梯度增加少量的方差。
本文提出了一个凸公式来实现方差和稀疏性的最优权衡：给定任何固定方差预算，都可以得到每个样本坐标的最优概率来决定是否丢弃该坐标。为了在线性时间内求解该优化问题，提出了几种在稀疏性保证下寻找近似最优解的有效算法。

2 Algorithm

给定一个数据集 ${x_n\}_{n=1}^N$

2.1 数学模化

尽管上述稀疏化算法能减少通信消耗，但会增加梯度的方差，这会影响模型收敛的速度，我们需要权衡方差和稀疏性，稀疏化后的梯度的方差为
$\mathbb{E}\sum_{i=1}^d[Q(g)_i^2]=\sum_{i=1}^d[\frac{g_i^2}{p_i^2}*p_i]=\sum_{i=1}^d\frac{g_i^2}{p_i}$

2.2 稀疏化算法

在本节中我们将介绍如何来求解概率向量 $p p ，因为 λ > 0 \lambda>0$

2.3 编码策略

我们接下来需要将稀疏化后的结果 $进行编码传输，我们先定义每个浮点数需要使用b比特来进行表示，我们使用两个向量，存放着概率为1的下标，存放着其他的下标。需要使用来表示索引以及来表示该索引的浮点数。而中的$

3 稀疏性的理论保证

在本节中我们将分布稀疏性的期望值 $\mathbb{E}[||Q(g)||_0]=\sum_{i=0}^dp_i$

4 总结

在本篇论文中，针对分布式机器学习的通信问题，提出了一个稀疏化的算法，通过该算法来减轻通信压力，我们对这个稀疏化算法进行了详细的介绍，并列举了相关算法来求解需要的概率向量。之后，我们分析了使用该算法后造成的梯度方差，为了缓解这个方差我们需要增加一定的迭代次数，分析迭代次数增加后实现的通信效率。

论文连接：Gradient Sparsification for Communication-Efficient Distributed Optimization

E - Evil Forest HDU - 6247

AC #include <cstdlib> #include <cstdio> #include <cmath> using namespace std; int main()

R语言入门：使用函数sample进行抽样

在医学统计学或者流行病学里的现场调查、样本选择经常会提到一个词：随机抽样。随机抽样是为了保证各比较组之间均衡性的一个很重要的方法。那么今天介绍的第一个函数就是用于抽样的函数sample：

webpack5之HMR原理探究

一、概念介绍模块热替换(hot module replacement 或 HMR)是 webpack 提供的最有用的功能之一。它允许在运行时更新所有类型的模块，而无需完全刷新。主要是通过以下几种方式，来显著加快开发速度：

dotproject的安装和中文化

dotproject 是一个很不错开源项目管理系统，

pycharm无法import本地安装好的第三方库问题

1、以为没有安装好所

springboot中自定义JavaBean返回的json对象属性名称大写变小写问题

文章目录

【YOLO系列】YOLOX（含代码解析）

文章目录环境配置

Linux释放内存空间

SIP Protocols

SIP Protocols http://www.packetizer.com/voip/sip/standards.html