最近发现了一个神奇的网站:www. 为什么说神奇呢,因为发现这个网站包含了一名叫做华校专的作者多年的算法学习笔记总结开源了出来,书中资料非常丰富,主要包含了如下主题:数学基础、统计学习、深度学习、常用工具。我看了下,心里约莫着这个笔记应该可以帮助很多同学提升一下。 笔记地址: http://www./ 数学部分包括线性代数基础、概率论基础、数值计算基础以及蒙特卡洛采样等。 统计学习部分包含了机器学习简介、支持向量机、朴素贝叶斯、决策树、集成学习、KNN、EM算法、主题模型等等。 深度学习专题也有涉及,从深度前馈神经网络到反向传播算法再到正则化、循环神经网络、卷积神经网络、Transformer、词向量、CTR模型都有介绍。 书中还有一些常用的小工具推荐,包括CRF、Lightgbm、Xgboost、Scikit-learn、Spark、Numpy、Scipy、Pandas、Matplotlib等常用的库和包。
数学基础 一位优秀的AI算法工程师应该有强大的数学基础,根据资料,线性代数你要会向量操作、矩阵运算以及特殊函数。概率论相关知识点,要掌握概率与分布、期望和方差、大数定律及中心极限定理、常见概率分布、先验分布与后验分布、信息论。 数值计算这门课程你要了解数值稳定性、梯度下降法、二阶导数与海森矩阵、牛顿法、拟牛顿法、约束优化。 当然,蒙特卡洛方法与 MCMC 采样也是必备的。
统计学习 除了常规的降维、聚类、半监督学习、支持向量机、朴素贝叶斯、决策树等。隐马尔可夫模型你需要知道:隐马尔可夫模型HMM、HMM 基本问题、最大熵马尔科夫模型MEMM。概率图与条件随机场也要掌握概率图模型、贝叶斯网络、马尔可夫随机场、条件随机场CRF 边际概率推断也要会精确推断和近似推断。主题模型要掌握Unigram Model、pLSA Model、LDA Model、LDA优化、sentence-LDA、模型讨论等。 统计学习这部分,是本资料篇幅最大,内容最丰富的一部分,算上机器学习简介,资料一共19个章节。
深度学习 深度学习共有9个章节,以深度学习简介开始以工程实践指导原则结束,需要掌握知识点如下所示: 工具部分 Python基础部分 全套手册PDF获取 |
|
来自: taotao_2016 > 《it》