摘要

首先,本文将带你了解机器学习到底是什么。

然后,小编将带你遍历机器学习领域最受欢迎的算法,并系统地学习这些算法。

本文还附有模型表和源码供大家使用。

3种机器学习模型的介绍与使用(3种机器学习模型的介绍与使用)(1)

机器学习并不新鲜,但是很有创意

机器学习或机器学习是一个概念,它可以帮助工业化趋势,如工业4.0,智能电网或自动驾驶汽车的新鲜血液。机器学习并不新鲜,算法也有几十年的历史。尽管如此,机器学习仍然是一种创新工具,因为在过去,只有抽象的应用,带有科学背景的机器学习,才能在日常的工业生产中找到相应的算法。以商业、医学和社会为导向的应用。机器学习不仅提高了我们的生活水平,也提高了我们的生活质量。

机器学习与人工智能

人工智能(人工智能)是一个在科学界仍然有很多争论的概念。人工智能是从哪里开始的? 自然智能是什么时候产生的? 智能究竟是什么?当这种人工智能下降时,大多数电影听众会认为像詹姆斯 · 卡梅隆的《终结者》或者人工智能这样的电影是斯蒂芬·斯皮尔伯格的。这部电影唤起了我们的期待(和恐惧) ,我们自己的自我学习系统长久以来都不能得到正确的对待。人们应该谈论人工智能而不是想象。

机器学习是人工智能的一部分,是一系列数学经验的集合,既可以用于一般原理(共性或相关界限的发现) ,也可以通过算法图像作为输入和训练数据的预期输出之间的联系。

机器学习与深度学习

深度学习是机器学习的一种特殊形式,预计在未来几年将成为标准。与此相关的是人工神经网络,有时也包含“传统”行为,这些行为可以在多个层面(神经网络的出生层面)和其他许多复杂的相互关系中学习深度学习(Deep Learning)这个概念的正确性。

机器学习与数据挖掘

数据挖掘指的是迄今为止还没有或者还没有得到足够的研究数据所带来的收益。机器学习的不受监督的过程,包括一些来自聚类和降维的过程,它们明确了数据挖掘的目的。这帮助我们人类可以更容易地解释多种多样和大量的数据。然而,机器学习的可能性远远超过了数据挖掘。

模型介绍与使用

在BQ上,有不断封装机器学习的算法策略,方便大家直接使用策略生成器开发策略,降低策略开发难度。本文对策略生成器已经支持的机器学习模型进行简单介绍。

目前,策略研究支持的机器学习模型有分类模型、回归模型、排序模型和聚类模型四类。

常用AI机器学习模型分类模型

分类模型主要包含以下模型:

模型名称

模块名称

线性分类

M.logistic_regression.

线性随机梯度下降分类

Mnear_sgd_classifier

支持向量机分类

M.svc

多层感知器分类

M.mlp_classifier

梯度提升树分类

M.gradient_boosting_classifier

极端随机数分类

M.extra_trees_classifier

自适应提升树分类

M.adaboost_classifier

随机森林分类

M.random_forest_classifier

XGBoost分类

M.xgboost

Bagging分类

M.bagging_classifier

k近邻分类

M.kneighbors_classifier

回归模型

回归模型主要包含以下模型:

模型名称

模块名称

线性回归

Mnear_regression.

线性随机梯度下降回归

Mnear_sgd_regressor

支持向量机回归

M.svr

多层感知器回归

M. mlp_regressor

极端随机数回归

M.extra_trees_regressor

自适应提升树回归

M.adaboost_regressor

随机森林回归

M. random_forest_regressor

梯度提升树回归

M.gradient_boosting_regressor

Bagging回归

M.bagging_regressor

XGBoost回归

M.xgboost

k近邻回归

M.kneighbors_regressor

排序模型

排序模型主要包含以下模型:

模型名称

模块名称

XGBoost排序

M.xgboost

Stock_ranker排序

M.stock_ranker

聚类模型

聚类模型主要包含以下模型:

模型名称

模块名称

层次聚类排序

M.cluster_agglomerative

近邻传播聚类

M.cluster_affinity_propagation

谱聚类

M.cluster_spectral

Birch聚类

M.cluster_birch

DBSCAN聚类

M.cluster_dbscan

K均值聚类

M.cluster_kmeans

线性模型

常见的线性模型之间的比较如下图所示。

3种机器学习模型的介绍与使用(3种机器学习模型的介绍与使用)(2)

树模型

常见的树模型之间的比较如下图所示。

3种机器学习模型的介绍与使用(3种机器学习模型的介绍与使用)(3)

重点模型介绍

下面,我们着重介绍几个模型,其余的模型可以在文档中查看介绍和使用方法。

StockRanker 模型

StockRanker 是 BigQuant为量化选股而设计,核心算法主要是排序学习和梯度提升树。

StockRanker = 选股 排序学习 梯度提升树

StockRanker有如下特点:

StockRanker的领先效果还得益于优秀的工程实现,我们在学习速度、学习能力和泛化性等方面,都做了大量的优化,并且提供了参数配置,让用户可以进一步根据需要调优。

随机森林模型

Bagging 算法是 bootstrap aggregation 的缩写,其核心思想是通过随机有放回的抽样构建训练数据集训练模型,最后组合,典型例子代表为随机森林模型。 随机森林模型使用多棵树进行单独预测,最后的结论由这些树预测结果的组合共同来决定,这也是“森林”名字的来源。每个基分类器可以很弱,但最后组合的结果通常能很强,这也类似于:“三个臭皮匠顶个诸葛亮”的思想。

随机森林模型有如下特点:

线性回归模型(SGD)

用回归方程定量地刻画一个因变量与多个自变量间的线性依存关系,称为多元线性回归分析。多元线性回归分析是多变量分析的基础,也是理解监督类分析方法的入口!实际上大部分学习统计分析和市场研究的人的都会用回归分析,操作比较简单。

在BQ上使用线性回归模型的独特之处在于,在最小化损失函数——均分误差的时候,采取的是随机梯度下降法(stochastic gradient descent),因此更高效。

最后,大家可以参考BQ上算法策略案例初步熟悉平台上各类算法的可视化流程。

小结: 本文对三种机器学习算法模型特点进行简单介绍,帮助大家进一步了解常用模型特点,在进行构建策略时做出最优选择。

,