共 16 篇文章 |
|
可视化大礼包 | 50 个数据可视化图表及其实现场景。发散型包点图(Diverging Dot Plot)也类似于发散型条形图(Diverging Bars)。下面的图表示基于类型变量对频率条进行分组,从而更好地了解连续变量和类型变量。Joy Plot 允许不同组的密度曲线重叠,这是一种可视化大量分组数据的彼此关系分布的好方法。27. 包点+箱形图(Dot+Box Plot)35. ... 阅58 转0 评0 公众公开 19-03-20 22:27 |
传统的特征工程方法使用领域知识一次仅构建一个特征,这是一个繁琐、耗时且容易出错的过程,我们称为手动特征工程。自动化特征工程使用一种适用于任何问题的框架,从一组相关数据表中自动提取有用且有意义的特征,改进了传统手工特征工程的标准流程。使用Featuretools的自动化特征工程流程。经过一些特征选择和模型优化后,与手动特征相比,这... 阅40 转0 评0 公众公开 19-02-12 14:57 |
pd.crosstab(df.area, df.market, margins=True, margins_name=u''''''''合计'''''''')pd.crosstab(df.area, df.market, normalize=True)pd.crosstab(df.area, df.market, normalize=''''''''index''''''''... 阅1543 转1 评0 公众公开 18-10-10 20:42 |
实战演练 | 如何用logistic回归预测婚姻出轨?4.将数据变量全变为数值型变量。结果的卡方值不显著(p=0.2108>0.05),表明四个预测变量的新模型与九个完整预测变量的模型拟合程度一样好。“在Logistic回归中,响应变量是Y=1的对数优势比(log)。回归系数的含义是当其他预测变量不变时,一单位预测变量的变化可引起的响应变量对数优势比的变... 阅381 转2 评1 公众公开 18-06-01 23:05 |
1. 神经元。神经元模型的一种学习方法称为Hebb算法:这和人脑中的神经元很相似:每一个神经元都有一些神经元作为其输入,又是另一些神经元的输入,数值向量就像是电信号,在不同神经元之间传导,每一个神经元只有满足了某种条件才会发射信号到下一层神经元。我们知道它把第七层的一大堆神经元的输出作为输入,第七层的神经元又是以第六层的一大... 阅19 转0 评0 公众公开 18-05-28 23:48 |
角度二:LR模型将线性分类函数转换为(条件)概率。但是单位阶跃函数不连续,所以我们希望找到一个替代函数来在一定程度上近似单位阶跃函数,并希望该函数单调可微,于是就引入了对数几率函数(sigmoid函数)逻辑回归和线性回归首先都可看做广义的线性回归,其次经典线性模型的优化目标函数是最小二乘,而逻辑回归则是似然函数,另外线性回归在... 阅526 转0 评0 公众公开 18-05-24 16:32 |
回归一词的现代解释是非常简洁的:回归时研究因变量对自变量的依赖关系的一种统计分析方法,目的是通过自变量的给定值来估计或预测因变量的均值。(1)挑选与因变量相关的自变量;一元线性回归和多元线性回归的区别在于,多元线性回归有一个以上的自变量,而一元线性回归通常只有一个自变量。因此这种方法不是直接用因变量和自变量分析,而是用... 阅177 转2 评0 公众公开 18-05-15 22:09 |
决策树模型是用于非线性指标分类的最简单的模型之一,举一个简单的在金融领域应用例子,比如我们想要进行因子选股,不同于传统的多因子模型,我们认为因子暴露度与个股收益率之间存在非线性关系,这时可以用决策树模型,选用动量(Mom)、波动率(Vol)、PE三个因子,通过下面的树模型决策过程得到股票组合。总结下来,涉及到的主要模型有:惩罚回... 阅677 转5 评0 公众公开 18-05-03 13:45 |
用Python入门不明觉厉的马尔可夫链蒙特卡罗(附案例代码)在过去几个月里,我在数据科学的世界里反复遇到一个词:马尔可夫链蒙特卡洛(Markov Chain Monte Carlo , MCMC)。创建这个模型,我们通过数据和马尔可夫链蒙特卡洛去寻找最优的alpha和beta系数估计。通过下面的这些代码可以创建完整的模型,其中包含了参数alpha 、beta、概率p以及观测... 阅530 转2 评0 公众公开 18-03-19 13:28 |
一文综述数据科学家必备的10大统计技术:线性回归、分类、无监督学习...线性回归模型。和 PCR 类似,PLS 也是一种降维方法,它首先提取一个新的较小的特征集合(原始特征的线性组合),然后通过最小二乘法将原来的模型拟合为一个新的具有 M 个特征的线性模型。广义加性模型(generalized additive model)是一种广义线性模型,其中线性预测器线... 阅36 转0 评0 公众公开 17-12-07 21:52 |