共 29 篇文章 |
|
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。这是一个典型的分类问题,转为数学问题就是比较p(嫁|(不帅、性格不好、身高矮、不上进))与p(不嫁|(不帅、性格不好、身高矮、不上进))的概率,谁的概率大,我就能给出嫁或者不嫁的答案!p(不帅、性格不好、身高矮、不上进|嫁) = p(不帅|嫁)*p(性格不好|嫁)*... 阅677 转7 评0 公众公开 17-04-11 08:32 |
该算法只计算“最近的”邻居样本,某一类的样本数量很大,那么或者这类样本并不接近目标样本,或者这类样本很靠近目标样本。随机从训练元组中选取k个元组作为初始的最近邻元组,分别计算测试元组到这k个元组的距离,将训练元组标号和距离存入优先级队列遍历训练元组集,计算当前训练元组与测试元组的距离,将所得距离L 与优先级队列中的最大距... 阅32 转0 评0 公众公开 17-03-18 23:36 |
scikit.在实际项目中,我们真的很少用到那些简单的模型,比如LR、kNN、NB等,虽然经典,但在工程中确实不实用。主要有两大类:接下来主要讲:小例子:给个简单例子:给个比较例子:几点说明:但切记,最好的参数还是通过CV调出来的。4)特征重要性评估:一个决策树,节点在越高的分支,相应的特征对最终预测结果的contribute越大。最后还是几个... 阅78 转0 评0 公众公开 17-03-18 23:30 |
作者总结了自己参加100多场机器学习竞赛的经验,主要从模型框架方面阐述了机器学习过程中可能会遇到的难题,并给出了自己的解决方案,他还列出了自己平时研究所使用的数据库、算法、机器学习框架等等,具有一定的参考价值。各种机器学习模型:Scikit-learn.一般,我们处理的变量有3种:一个是数据变量、种类变量和内含文本的变量。在贪婪特征的... 阅71 转0 评0 公众公开 17-03-18 23:28 |
Python中网络页面抓取和页面分析。而urllib、urllib2是借助于httplib、httplib2实现的,相当于在httplib、httplib2上又封装了一层来进行处理web数据。httplib2的安装:首先下载python的httplib2的安装包,下载地址为:http://code.google.com/p/httplib2/downloads/list;下面再给出一个httplib2的学习地址,是httplib2的一个wiki,里面有几个h... 阅1723 转4 评0 公众公开 17-02-28 20:32 |
# 导入BeautifulSoup模块和re模块,re是python中正则表达式的模块 import BeautifulSoup.鐣欏璁哄潧-涓€浜?-涓夊垎鍦? import re # 生成一个soup对象,doc就是步骤二中提到的 soup = BeautifulSoup.BeautifulSoup(doc) # 抓取论文标题,作者,简短描述,引用次数,版本数,引用它的文章列表的超链接. From 1point 3acres bbs # 这里还... 阅201 转0 评0 公众公开 17-02-28 17:13 |
该系统主要用于:大数据基础建设,舆情监测,品牌监测,价格监测,门户网站新闻采集,行业资讯采集,竞争情报获取,商业数据整合,市场研究,数据库营销等领域。网络神采是一款专业的网络信息采集系统,通过灵活的规则可以从任何类型的网站采集信息,如新闻网站、论坛、博客、电子商务网站、招聘网站等等。支持网站登录采集、网站跨层采集、POS... 阅3715 转18 评0 公众公开 17-02-28 17:10 |
2. 在CNTK-Python环境下,切换C:\repos\CNTK\Examples\Image\DataSets\MNIST文件夹为当前目录,输入python install_mnist.py命令,运行Python脚本install_mnist.py下载MNIST训练集和测试集,并转换为.txt文档。4. 3中的训练过程和测试过程也可以用Python语言编写的.py文件实现,将当前目录切换到C:\repos\CNTK\bindings\python\examples\MNIST... 阅301 转2 评0 公众公开 16-12-29 21:16 |
TensorFlow和CNTK都属于脚本驱动型的。InteractiveSession()W_conv1 = weight_variable([5, 5, 1, 32], "wconv")b_conv1 = bias_variable([32], "bconv")W_conv2 = weight_variable([5, 5, 32, 64], "wconv2")b_conv2 = bias_variable([64], "bconv2")W_fc1 = weight_variable([7 * 7 * 64, 1024], &q... 阅165 转1 评0 公众公开 16-12-29 20:52 |
我们也可以通过探究CNTK的源码来找出节点数据存储的位置,直接使用CNTK的文件即可, 这种情况,只需要我们在我们的程序中加载CNTK中的EvalDLL读取网络模型文件后,直接使用其参数,后者根据需要导出成我们所期望的形式。本文主要是描述了CNTK中网络节点训练结果的导出方法,首先将CNTK当做工具使用情况下的导出方法,之后接受的是将CNTK看做一... 阅362 转4 评0 公众公开 16-12-29 20:48 |