作者:华校专 华校专,曾任阿里巴巴资深算法工程师、智易科技首席算法研究员,现任腾讯高级研究员,《Python 大战机器学习》的作者。 编者按 对于想要了解模型的底层逻辑,优化算法性能的工程师,线性代数、高等数学、概率论都是必备的基础知识。作者以浅显的语言,深入浅出的总结了算法中涉及的主要数学知识,对于工作中速查和深入学习都大有裨益。
线性代数一、基本知识1.本书中所有的向量都是列向量的形式: 本书中所有的矩阵 都表示为: 简写为: 或者 。 2.矩阵的F范数:设矩阵 ,则其F 范数为: 。 它是向量的范数的推广。 3.矩阵的迹:设矩阵 ,则 的迹为: 。 迹的性质有:
。
二、向量操作1.一组向量 是线性相关的:指存在一组不全为零的实数 ,使得: 。 一组向量 是线性无关的,当且仅当 时,才有: 。 2.一个向量空间所包含的最大线性无关向量的数目,称作该向量空间的维数。 3.三维向量的点积: 4.三维向量的叉积: 其中 分别为 轴的单位向量。 1. 和 的叉积垂直于 构成的平面,其方向符合右手规则。
5.三维向量的混合积: 其物理意义为:以 为三个棱边所围成的平行六面体的体积。当构成右手系时,该平行六面体的体积为正号。 6.两个向量的并矢:给定两个向量 ,则向量的并矢记作: 也记作 或者 。
概率论与随机过程一、概率与分布1.1 条件概率与独立事件1.条件概率:已知事件发生的条件下发生的概率,记作,它等于事件的概率相对于事件的概率,即: 。其中必须有 。 2.条件概率分布的链式法则:对于个随机变量,有: 3.两个随机变量相互独立的数学描述:。记作:。 4.两个随机变量关于随机变量条件独立的数学描述:。记作: 。
二、期望和方差2.3 协方差与相关系数1.对于二维随机变量 (X,Y) ,可以讨论描述 X 与 Y 之间相互关系的数字特征。
2.由定义可知: 3.协方差的性质:
4.协方差的物理意义:
定义随机变量 ,则随机变量 是非独立的,但是有: 。 5.相关系数的物理意义:考虑以随机变量的线性函数 近似表示Y。以均方误差 来衡量以近似表达的好坏程度。越小表示近似程度越高。 为求得最好的近似,则对 分别取偏导数,得到: 因此有以下定理:
6.当 较大时, 较小,意味着随机变量 和 联系较紧密。于是 是一个表征 之间线性关系紧密程度的量。 7.当 时,称 和 不相关。
五、常见概率分布5.1 均匀分布离散随机变量的均匀分布:假设 有 个取值: ,则均匀分布的概率密度函数 连续随机变量的均匀分布:假设 X 在 上均匀分布,则其概率密度函数 5.2 伯努利分布1.伯努利分布:参数为 。随机变量 。
2. 其中 为参数,它满足 ,且 。 5.3 二项分布1.假设试验只有两种结果:成功的概率为 ,失败的概率为 。则二项分布描述了:独立重复地进行次试验中,成功 次的概率。
5.4 高斯分布正态分布是很多应用中的合理选择。如果某个随机变量取值范围是实数,且对它的概率分布一无所知,通常会假设它服从正态分布。有两个原因支持这一选择: 建模的任务的真实分布通常都确实接近正态分布。中心极限定理表明,多个独立随机变量的和近似正态分布。 在具有相同方差的所有可能的概率分布中,正态分布的熵最大(即不确定性最大)。
线性代数 (http://www./%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/chapters/1_algebra.html 概率论与随机过程(http://www./%E6%95%B0%E5%AD%A6%E5%9F%BA%E7%A1%80/chapters/2_probability.html) 文章作者:华校专 |
|