您现在的位置: 首页 > 网站导航收录 > 百科知识百科知识
机器学习算法有哪些?
神经网络,算法,优点机器学习算法有哪些?
发布时间:2020-12-06加入收藏来源:互联网点击:
问题补充: 机器学习算法有哪些?想成为一名机器学习工程师,需要精通哪些算法?
回答于 2019-09-11 08:43:50
回答于 2019-09-11 08:43:50
你应该使用哪种机器学习算法?这在很大程度上依赖于可用数据的性质和数量以及每一个特定用例中你的训练目标。不要使用最复杂的算法,除非其结果值得付出昂贵的开销和资源。这里给出了一些最常见的算法,按使用简单程度排序。
1. 决策树(Decision Tree):在进行逐步应答过程中,典型的决策树分析会使用分层变量或决策节点,例如,可将一个给定用户分类成信用可靠或不可靠。
2. 支持向量机(Support Vector Machine):基于超平面(hyperplane),支持向量机可以对数据群进行分类。
3. 回归(Regression):回归可以勾画出因变量与一个或多个因变量之间的状态关系。在这个例子中,将垃圾邮件和非垃圾邮件进行了区分。
4. 朴素贝叶斯分类(Naive Bayes Classification):朴素贝叶斯分类器用于计算可能条件的分支概率。每个独立的特征都是「朴素」或条件独立的,因此它们不会影响别的对象。例如,在一个装有共 5 个黄色和红色小球的罐子里,连续拿到两个黄色小球的概率是多少?从图中最上方分支可见,前后抓取两个黄色小球的概率为 1/10。朴素贝叶斯分类器可以计算多个特征的联合条件概率。
5. 隐马尔可夫模型(Hidden Markov model):显马尔可夫过程是完全确定性的——一个给定的状态经常会伴随另一个状态。交通信号灯就是一个例子。相反,隐马尔可夫模型通过分析可见数据来计算隐藏状态的发生。随后,借助隐藏状态分析,隐马尔可夫模型可以估计可能的未来观察模式。在本例中,高或低气压的概率(这是隐藏状态)可用于预测晴天、雨天、多云天的概率。
6. 随机森林(Random forest):随机森林算法通过使用多个带有随机选取的数据子集的树(tree)改善了决策树的精确性。本例在基因表达层面上考察了大量与乳腺癌复发相关的基因,并计算出复发风险。
7. 循环神经网络(Recurrent neural network):在任意神经网络中,每个神经元都通过 1 个或多个隐藏层来将很多输入转换成单个输出。循环神经网络(RNN)会将值进一步逐层传递,让逐层学习成为可能。换句话说,RNN 存在某种形式的记忆,允许先前的输出去影响后面的输入。
8. 长短期记忆(Long short-term memory,LSTM)与门控循环单元神经网络(gated recurrent unit nerual network):早期的 RNN 形式是会存在损耗的。尽管这些早期循环神经网络只允许留存少量的早期信息,新近的长短期记忆(LSTM)与门控循环单元(GRU)神经网络都有长期与短期的记忆。换句话说,这些新近的 RNN 拥有更好的控制记忆的能力,允许保留早先的值或是当有必要处理很多系列步骤时重置这些值,这避免了「梯度衰减」或逐层传递的值的最终 degradation。LSTM 与 GRU 网络使得我们可以使用被称为「门(gate)」的记忆模块或结构来控制记忆,这种门可以在合适的时候传递或重置值。
9. 卷积神经网络(convolutional neural network):卷积是指来自后续层的权重的融合,可用于标记输出层。
回答于 2019-09-11 08:43:50
机器学习算法有很多,参考《机器学习》(周志华),著名西瓜书的目录:
第一章 绪论
第二章 模型评估与选择
第三章 线性模型
第四章 决策树
第五章 神经网络
第六章 支持向量机
第七章 贝叶斯分类器
第八章 集成学习
第九章 聚类
第十章 降纬与度量学习
第十一章 特征选择与稀疏学习
第十二章 计算理论学习
第十三章 半监督学习
第十四章 概率图模型
第十五章 规则学习
第十六章 强化学习
从第三章开始都是常用的机器学习算法。书籍的前10章是比较基本的要求。
另外,不仅机器学习算法本身重要,如何选择合适的算法和算法参数并加以改造到自己的项目中更是考察能力,这就需要在实践中总结。西瓜书是一本很好的机器学习入门书籍。
最后,附上书籍的网址:
https://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/MLbook2016.htm#
其中有周老师给大家的读书建议。
回答于 2019-09-11 08:43:50
下一篇:返回列表
相关链接 |
||
网友回复(共有 0 条回复) |