雷锋网 AI 科技评论按:凭借强大的统计学基础,机器学习正成为当下最有趣、发展节奏最快的计算机科学领域之一。机器学习可以被应用到无数的行业和应用中,以提供更高效和智能的服务体验,最典型的如聊天机器人、垃圾邮件过滤器、广告投放系统、搜索引擎以及欺诈检测系统,正为我们的日常生活提供全方位的支持。
简单来说,机器学习可以让我们为那些人类无法做到的事情去找到解决方案,并创建相应的数学模型。与涵盖探索性数据分析、统计学、通信技术以及可视化技术等内容的数据科学课程不同的是,机器学习课程只注重教授机器学习算法,即它们如何以数学的方式运作,以及我们要如何在编程语言中使用它们。为此,LearnDataScience 为大家推荐了 5 个最值得投入时间与精力的机器学习课程,雷锋网 AI 科技评论将之编译如下。
首先让我们对今年 Top 5 的机器学习课程进行简要回顾:
Machine Learning(机器学习) - Coursera
网址:https://www.Coursera.org/learn/machine-learning
Deep Learning Specialization(深度学习专项课程) - Coursera
网址:https://www.coursera.org/specializations/deep-learning
Machine Learning with Python(基于 Python 的机器学习) - Coursera
网址:https://www.coursera.org/learn/machine-learning-with-python
Advanced Machine Learning Specialization(进阶版机器学习专项课程) - Coursera
网址:https://www.coursera.org/specializations/aml
Machine Learning(机器学习) - EdX
网址:https://www.edx.org/course/machine-learning
怎样才算是优质的机器学习课程?
经过多年沉浸于线上学习并参加了无数的机器学习课程(Coursera、 Edx、 Udemy、 Udacity、DataCamp 等)后,我将我当下认为最棒的机器学习课程进行了汇总。
在这张表单里,所有课程都满足了以下几点:
专注于机器学习
使用免费、开源的编程语言,如 Python、R 语言或者 Octave
使用免费、开源的语言库。使用商业库的课程将被排除在外
拥有供线下进行练习与实践的编程作业
详细解释那些算法是如何以数学的方式运作的
学生可按个人需求灵活安排学习进度
有魅力的督导以及有趣的讲座
在行业网站与论坛中获得高于平均水平的打分和反馈
按照这些标准,我们很快淘汰了一部分课程,目标是为了找到一个值得你投入时间与精力的课程。
为了让你沉浸其中,并尽可能快速全面地掌握机器学习,我认为除了线上学习以外,你还应该多看各种书籍。以下这两本书籍就对我的学习经历产生过重大影响:
《 Introduction to Statistical Learning 》(统计学习简介)
免费获取网址:http://www-bcf.usc.edu/~gareth/ISL/
本书提供了清晰、直接的释义和示例,以提高你对基本机器学习技术的数学直觉。这本书更多地涉及理论方面的知识,但同时包含许多基于 R 语言的练习例子。
《 Hands-On Machine Learning with Scikit-Learn and TensorFlow 》基于 Scikit-Learn 和 TensorFlow 的手动机器学习
Safari 订阅链接:https://learning.oreilly.com/signup/?utm_medium=affiliate&utm_source=cj&utm_campaign=paid&utm_content_cj_13339361_7888980
对前一本书进行了有效补充,主要关注如何使用 Python 创建机器学习应用。再结合任一学习课程,这本书将能有效强化你的编程技巧,并懂得如何快速将学习到的机器学习技术转化为具体项目。
现在,让我们一起看看关于 Top 5 课程的描述与评价:
Machine Learning(机器学习) - Coursera
网址:https://www.coursera.org/learn/machine-learning
不夸张的说,其他机器学习课程都将这门课程视为标杆。课程的讲师与创建者是 Andrew Ng(吴恩达)——斯坦福大学教授、Google Brain 联合创始人、Coursera 联合创始人、曾将百度 AI 团队培养成千人规模的副总裁。
该课程采用开源编程语言 Octave ,而非常规的 Python 或 R 语言来布置作业。这对于某些人而言可能有点标新立异,而事实上如果你是一名初学者,Octave 将是一个学习 ML 基础知识的简单方法。
总的来说,这门课程的材料非常全面,吴恩达也对此进行了详尽讲述。他将基于微积分解释以及线性代数向你解释算法背后的数学逻辑。这是一门独立的学习课程,但如果能事先对线性代数有了解,对你学习这门课程将有很大的帮助。
课程提供者:斯坦福大学的 Andrew Ng(吴恩达)
费用:审核免费,证书要价 79 美元
课程大纲:
单变量的线性回归
线性代数回顾
基于多个变量的线性回归
Octave / Matlab 教程
逻辑回归
正则化
神经网络:表示
神经网络:学习
对于运用机器学习的建议
机器学习系统设计
支持向量机
降纬
异常检测
推荐系统
大规模的机器学习
应用示例:Photo OCR
课程将在十一周内传授完毕。如果你能坚持完成课程,只需 4 个月,就能掌握机器学习的基础知识。
此后,你可轻松选择下一个专业主题课程,比如深度学习、机器学习工程或者任何能够激起你学习兴趣的内容。
毫无疑问,对初学者而言这是一门理想的起步课程。
Deep Learning Specialization(深度学习专项课程) - Coursera
网址:https://www.coursera.org/specializations/deep-learning
同样是吴恩达主讲,不同的是,这门专项课程属于高阶系列课程,适合那些有兴趣学习神经网络与深度学习、并利用它们来解决问题的人。
这门课程涉及神经网络的作业和讲座将采用 Python 语言以及 TensorFlow 库。不用说,这是学习完吴恩达《机器学习》课程后的最佳延续,因为课程是你习惯的讲解风格,只不过现在就需要你适应使用Python 来创建机器学习项目。
课程提供者:吴恩达、deeplearning.ai
费用:审核免费,证书要价 49 美元/月
课程大纲:
1.神经网络与深度学习
深度学习简介
神经网络基础知识
浅层神经网络
深度神经网络
2.神经网络的改进:超参数调整、正则化与优化
深度学习的实践
优化算法
超参数调整、批量标准化与编程框架
3.机器学习项目构建
机器学习策略(1)
机器学习策略(2)
4.卷积神经网络
卷积神经网络基础
深度卷积模型:案例研究
物体检测
特殊应用:人脸识别和神经风格转移
5.序列模型
递归神经网络
自然语言处理和 Word 嵌入
序列模型和注意机制
为了理解课程中的算法,你应该要熟悉线性代数和机器学习的通用知识。
Machine Learning with Python(基于 Python 的机器学习) - Coursera
网址:https://www.coursera.org/learn/machine-learning-with-python
又是一个针对初学者的课程,专注传授那些最基本的机器学习算法。教师、幻灯片以及说明的完美结合,能让你对基础算法有最直观的感受。
本课程采用的 Python,对算法背后的数学公式要求没那么高。 通过每个学习模块,你将有机会利用浏览器中的 Jupyter notebook 对刚学过的概念进行实践。 每个 notebook 将有效强化你之前的学习知识,同时提供在实际数据上进行算法实践的具体说明。
课程提供者:IBM,Cognitive Class
价格:审核免费,证书要价 39 美元/月
课程大纲:
机器学习简介
回归
分类
聚类
推荐系统
课程项目
该课程的优点是会给每个算法提供实用的建议——每当引入一种新算法,讲师会向你解释它的工作原理、优缺点以及使用场景。这些经常会被其他课程所忽略,而这些信息对于初学者而言非常重要,因为这可以帮助他们了解算法背后的大背景。
Advanced Machine Learning Specialization(进阶版机器学习专项课程) - Coursera
网址:https://www.coursera.org/specializations/aml
另一个高阶系列课程, 如果你有兴趣学习更多的机器学习技术,这是一门很关键的线上课程。
该课程的教学水平非常高:精彩又简洁。由于课程的前沿性,您需要比其他课程拥有更扎实的数学基础。如果你之前已经报读过其他初学者课程,并拥有线性代数和微积分知识基础,那么这是你补充专业的机器学习知识的不错选择。
该课程涵盖的大部分内容对于许多机器学习项目的实践而言至关重要。
课程提供者:俄罗斯国立高等经济学院
费用:审核免费,证书要价 49 美元/月
课程大纲:
1.深度学习简介
优化简介
神经网络简介
用于图像的深度学习
无监督表示学习
序列深度学习
课程项目
2.如何在数据科学竞赛中胜出:向顶级的 Kagglers 学习
介绍与回顾
模型的特征处理与生成
课程项目描述
探索性数据分析
验证
数据泄漏
度量标准优化
高级特征工程 1
超参数优化
高级特征工程 2
集成学习
比赛经历
最终项目
3.机器学习的贝叶斯方法
贝叶斯方法和共轭引物简介
期望最大化算法
变分推断和隐狄利克雷分配模型(LDA)
马尔可夫链蒙特卡罗
自动变分编码器
高斯过程和贝叶斯优化
课程项目
4.强化学习实践
简介:与我何干?
强化学习核心:动态编程
无模型方法
基于近似值方法
基于政策方法
探索
5.计算机视觉中的深度学习
图像处理和计算机视觉入门
视觉识别的卷积特征
物体检测
物体跟踪与动作识别
图像分割与合成
6.自然语言处理
前言、文本分类
语言建模和序列标记
语义向量空间模型
序列到序列任务
对话系统
7.利用机器学习方法应对大型强子对撞机挑战
针对数据科学家的粒子物理入门
粒子识别
从稀有衰变中寻找新物理学
利用机器学习在新CERN实验中寻找关于暗物质的提示
探测器优化
完成课程学习大约需要 8 到 10个月的时间,这也意味着如果是从今天开始学习,不到一年的时间里,你将学到大量的机器学习知识,并能够处理更多顶尖的应用程序。
此外,你将在这几个月时间里创建让计算机懂得自行学习阅读、查阅以及玩耍的项目。对未来的雇主而言,这些体现在 Github 上的项目将成为你履历中漂亮的一环。
Machine Learning(机器学习) - EdX
网址:https://www.edx.org/course/machine-learning
相对而言其他课程而言,这是对数学能力要求最高的一门高阶课程。这意味着你需要掌握牢固的线性代数、微积分、概率学和编程知识。该课程将基于 Python 或 Octave 布置有意思的编程作业,却不会具体教授任一语言。
本课程最大的特点是对机器学习的概率方法进行了覆盖。如果你对阅读教科书(如《Machine Learning: A Probabilistic Perspective》.机器学习:概率学视角)很感兴趣,那么这门课将是很理想的补充。
课程提供者:哥伦比亚大学
费用:审核免费,证书要价 300 美元
课程大纲:
最大似然估计、线性回归、最小二乘法
岭回归、偏差方差、贝叶斯规则、最大后验推断
最近邻分类、贝叶斯分类器、线性分类器、感知器
逻辑回归、拉普拉斯近似、核方法、高斯过程
最大边距、支持向量机(SVM)、树状图、随机森林、提升
聚类、K 均值、EM 算法、缺失数据
高斯混合、矩阵分解
非负矩阵分解、潜在因子模型、PCA 和变化
马尔可夫模型、隐马尔可夫模型
连续状态空间模型、关联分析
型号选择、后续步骤
该课程提到的许多主题都包含在其他针对初学者的课程里,然而数学元素却未被淡化。如果你已经学习了基础技术知识,同时有兴趣深入研究数学,且希望从事实际推导出某种算法的编程作业,那么本课程最合适不过。
via https://medium.com/@LearnDataSci/top-5-machine-learning-courses-for-2019-8a259572686e
雷锋网 AI 科技评论
,