共 288 篇文章
显示摘要每页显示  条
数据科学领域全景。机器学习是计算机算法的研究领域,计算机算法允许计算机程序识别并从数据中提取模式。本质上,数据挖掘是指一种利用机器学习算法从数据中提取见解的结构化方法。这些类型的机器学习之间的主要区别在于,对包含输入和输出数据的数据进行监督学习。除了监督和非监督机器学习算法的主流之外,还有其他变化,例如半监督和强化学...
机器学习中的特征选择初探【sklearn实战】sklearn中也提供了包裹式的特征选择方法,比如SelectFromModel、RFE(递归消除法)、RFECV(RFE的交叉验证版),它们都需要我们指定一个评估器(estimator,比如LogisticRegression),然后针对这个评估器,它们会自动选择最佳的特征子集。原数据集中的特征数: 4 ?原数据集中不同特征的方差: [0.6811...
机器学习和数据科学的最佳公共数据集数据集查找器。SOCR 数据 - 高度和重量数据集:这是初学者的基本数据集。推荐系统数据集:它包含来自流行网站的各种数据集,如Goodreads书评、亚马逊产品评论、调酒数据、社交媒体数据以及其他用于构建推荐系统的数据集。[1] The 50 Best Free Datasets for Machine Learning, Lionbridge AI, https://lionb...
一文总结数据科学家常用的Python库(上)这些库有着不同的数据科学功能,例如数据收集,数据清理,数据探索,建模等,接下来我们会分类介绍。12用于数据操作的Python中有用的熊猫技术(https://www.analyticsvidhya.com/blog/2016/01/12-pandas-techniques-python-data-manipulation/)CheatSheet:使用Python中的Pandas进行数据探索(https://www...
将上面含函数的功能模块py文件取文件名为“试验”,保存后得到“试验.py”文件,就是一个可供其他py文件导入调用的模块。检查一下,是不是运行的Py文件所在文件夹里是否也存在一个与导入的模块文件同名的cfjoin.py文件,如果有,而且这个文件里的内容与lib文件夹里的cfjoin.py内容不同。如果当前文件夹下某个py文件名正好与lib库里的模块文件同...
5个基本概念,从统计学到机器学习。本文讲述了数据分析师应当了解的五个统计基本概念:统计特征、概率分布、降维、过采样/欠采样、贝叶斯统计方法。它涉及应用一些数学理论来分析事件发生的概率,明确地说,我们唯一计算的数据是先验数据(prior data)。在方程中的概率P(H)基本上是我们的频率分析,给定之前的关于事件发生概率的数据。当你觉得...
都是通过将数据用一个函数进行转换,最终得到结果,其实啊,Sigmoid就是一钟核函数来着,而上面说的那种方式,是高斯核函数。3.上面举例这种情况属于高斯核函数,而实际常见的核函数还有多项式核函数,Sigmoid核函数等等。- gamma:核函数系数,仅在核函数为高斯核,多项式核,Sigmoid核(即“rbf“,“poly“ ,“sigmoid“)时生效。float类...
直方图的数值变量,带有计数图的分类变量,数值变量与散点图,joint plots和pair plots之间的关系数值和分类变量与盒须图和复杂条件图之间的关系。让我们从数值变量开始,特别是我们的目标变量SalePrice。既然我们已经探索了数值和分类变量,那么让我们来看看这些变量之间的关系 - 更重要的是,这些变量如何影响我们的目标变量SalePrice!盒须...
介绍常用的数据结构:数组,栈,链表,队列,树,图,堆,散列表。二叉树是树的特殊一种,具有如下特点:这里的对应关系 f 成为散列函数,又称为哈希 (hash函数),而散列表就是把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字,然后就将该数字对数组长度进行取余,取余结果就当作数组的下标,将value存储在以该数字为下标的数...
做数据可视化,为什么我们不再直接使用D3.js、Echarts.简单点,是一个JavaScript函数库,使用它主要用来做数据可视化。不过做数据可视化有了更好的解决办法,NBI一站式大数据可视化分析平台深度集成了D3.js,Echarts,经过对它们的二次封装,使得在平台上可以实现零编码、拖拽式即可实现数据可视化的能力。几分钟即可完成数据报告的制作,保存后...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部