机器学习分类算法之评价指标开发机器学习系统的一个新途径

更多深度文章，请关注：https://yq.aliyun.com/cloud，今天小编就来聊一聊关于机器学习分类算法之评价指标开发机器学习系统的一个新途径?接下来我们就一起去研究一下吧!

更多深度文章，请关注：https://yq.aliyun.com/cloud

Certigrad是一种新的开源的随机计算图优化系统，它是用于开发机器学习系统的一个新途径。其中包含以下组件：

应用本身
基础数据库
应用在数学上所需求的形式化描述
应用满足其形式化描述的机器可测证明

具体来说，Certigrad是一个优化的随机计算图形系统，我们使用Lean Theorem Prover验证系统，最终证明了在基础数学上是正确的。

背景：随机计算图

随机计算图扩展了像TensorFlow和Theano这样的系统的计算图，它允许节点表示随机变量，并通过定义损失函数来表示叶节点和图中所有随机选择的总和的期望值。Certigrad允许用户从我们提供的原语中构造任意的随机计算图。该系统的主要目的是采用一个描述随机计算图的程序，并运行随机算法（随机反向传播），同时期望对参数的损失函数的梯度进行采样。

正确性

随机算法

这是定理详述，并证明了我们的随机反向传播的实现是正确的：

我们对数学基础进行了理论化，而不是从最初的原理来构造它。

尽管我们的正确性定理只适用于无限精度实数，但我们必须用浮点数执行。

为了性能，我们在运行时用对Eigen的调用来替换原始的张量操作。

系统在虚拟机中执行，虚拟机的设计不像核心逻辑的验证检查器那样值得信赖。

性能

可证明的正确性不必以计算效率为代价:证明只需检查一次，并且不引入任何持续的成本或运行时开销。尽管我们在这项工作中验证的算法缺乏很多优化，但大多数时间训练机器学习系统都是用矩阵来做的，而且我们可以通过与矩阵运算(Eigen)的优化库连接来实现竞争性能。我们使用ADAM在MNIST上训练了一个自动编码变异贝叶斯（AEVB）模型，发现我们的性能与TensorFlow（在CPU上）具有竞争力。

我们有一个脚本，可以在MNIST上用ADAM来训练AEVB。

https://github.com/dselsam/certigrad/blob/master/src/certigrad/aevb/mnist.lean#L44-L66

优点

尽管我们的方法引入了许多新的挑战，但它也带来了实质性的好处。

调试

首先，我们的方法论提供了一种系统地调试机器学习系统的方法。

实现错误在机器学习系统中很难发现，更不用说进行本地化和地址处理了，因为还有许多其他潜在的不需要的行为。例如，一个实施的错误可能导致不正确的梯度，从而导致学习算法停滞，但是这样的症状也可能是由于训练数据中的噪声，模型选择不当，不利的优化环境，不适当的搜索策略，或数值不稳定。这些其他问题是如此普遍，以至于人们常常认为任何不想要的行为都是由其中一个原因引起的。因此，实际的实现错误可以在不检测的情况下无限期地存在。在随机程序中，错误更难以检测，因为一些错误可能只会扭曲随机变量的分布并且可能需要编写自定义的统计测试来检测。

使用我们的方法论，正式的规范可以被用于在逻辑层次上进行详尽地测试和调试机器学习系统，而不需要借助于经验性的测试。验证该规范的过程将暴露所有的实现错误、疏忽和隐藏的假设。一旦它被证明了，每个感兴趣的人都可以确信，实现是正确的，而不需要信任任何涉及的人或者理解程序是如何工作的。

合成

其次，我们的方法论可以使实现的某些部分自动合成。

然而使用现状方法，编译器不知道程序应该做什么，因此只能捕获表面的语法错误，用我们的方法论，这个定理证明了程序应该做什么，并且能够提供更多有用的帮助。作为一个简单的例子，假设我们要将一个2层MLP编译成一个单一的原始运算符，以避免运行时图形处理的开销。通常这涉及到手工推导复合函数的梯度。然而，由于在我们的方法论中，定理证明者知道基础数学，包括相关的梯度规则和张量的代数性质，它可以帮助推导出新算子的梯度。

合成的可能性不仅仅是自动化代数推导。在开发Certigrad时，我们开始证明该规范在实施系统的困难部分之前已经被使用，并且使用所产生的证明义务来帮助确定程序需要做什么。正式的规范，以及最终的正确性的机器可校验的证明，使我们能够正确地实施系统，而无需对系统为什么正确的一致而全局的理解。事实上，我们主要把这一重担转移到电脑上。

积极优化

第三，我们的方法论可能使安全自动化比其他方法更积极的转换。例如，我们可以编写一个程序，搜索一个可以被分析的随机计算图的组成部分，它利用了大型积分恒等式库，以及人类无法手动模拟的过程方法。这样的过程可能能够在许多模型上实现超人为差异减少，但可能非常难以可靠地实现;如果该过程能够为给定的变换生成一个机器可检查的证书，那么不管过程本身的复杂性如何，这个转换都可以被信任。

文档

第四，一个正式的规范(即使没有正式的证明)可以作为一个系统的精确文档，并且可以让我们更容易地理解代码的各个部分，在不同的地方所假定的先决条件，以及不变量的维护。这种精确的文档对于任何软件系统都是有用的，但是对于机器学习系统尤其有用，因为不是所有的开发人员都有必要的数学知识来填补非正式描述的空白。

渐进性

我们的方法论对于高保证系统来说可能已经很经济了，但是仍然有许多工作要做，以使它在主流的开发中变得实用，而正确性仅仅是“可选的”。然而，我们的方法论的一个关键方面是它可以被逐步采用。你可以只写一小段代码，然后简单地包装和公理化(就像我们对Eigen做的那样)。你也可以编写浅层的正确性，并且只证明其中的一些属性是成立的。我们希望随着时间的推移，随着工具的成熟，开发人员将会发现，进一步追求我们的方法论是值得的，并且能够收获更多的好处。

搭建Certigrad

Lean仍然在开发中，而外部功能接口(FFI)还没有被移植到主分支。我们复制Lean项目以添加C 代码来将Eigen加入到Lean的虚拟机中，但是，一旦FFI被发布，我们将把Certigrad移植到Lean主分支。

至此之前：

1.下载我们的Lean项目从https://github.com/dselsam/lean/tree/certigrad并且根据在https://github.com/leanprover/lean中的说明构建/安装。

2.下载Eigen并安装。

3.下载这个库，并在主目录执行leanpkg --建立。

注意：搭建Certigrad目前需要大约15分钟和大约7 GB的内存消耗。

警告

我们已经正式证明Certigrad是正确的(在上面提到的问题)，但这并不意味着Certigrad是你所期望的那样。它的意思是，根据假设，与上面相关的定理是正确的。

Certigrad的设计是一个概念证明，不是一个生产系统。有许多功能需要添加，使之成为一个有用的工件。在发展的过程中，我们遇到了很多需要解决的问题来使我们的方法论经济化，并且我们在解决这些挑战比扩展和维护Certigrad作为目的本身更感兴趣。

更多信息

一篇描述了Certigrad背后的理念的文章可以在 https://arxiv.org/abs/1706.08605 看，并将在2017年的ICML中出现。