击碎星辰的图书馆

他的首页他的馆藏他的动态馆友反馈关于他分享对话

击碎星辰

文章		关注		粉丝		访问		贡献

关注

粉丝

访问

贡献

他的首页

他的馆藏

他的动态

馆友反馈

关于他

共 11 篇文章

显示摘要

每页显示

条

在进行文本分类的时候，我们可以让计算机这样来看待我们提供给它的训练样本，每一个样本由一个向量（就是那些文本特征所组成的向量）和一个标记（标示出这个样本属于哪个类别）组成。当用归一化的w和b代替原值之后的间隔有一个专门的名称，叫做几何间隔，几何间隔所表示的正是点到超平面的欧氏距离，我们下面就简称几何间隔为"距离"...

阅10 转自funson 公众公开 10-06-10 22:55

SVM学习之四——从机器学习到支持向量机http://axywestwind.bokee.com/viewdiary.14525093.html.

阅17 转自danis_zn 公众公开 10-06-10 22:53

详述SEO的本质与向量空间模型

详述SEO的本质与向量空间模型。向量空间模型（VSM）是近年来应用最多且效果较好的方法之一，在该模型中，文档向量空间被看作是由一组正交词条向量所组成的向量空间。其中，检索效果较好且较通用的是向量空间模型和概率模型。作为想深入到SEO的本质的学习者来说，要想学习检索模型，就必须深入研究向量空间模型、概率模型、语言模型等基本模型或...

阅1265 转17 评0 公众公开 10-06-10 22:01

本体论及语义搜索引擎

本体论及语义搜索引擎本体论及语义搜索引擎。2.1 本体的概念本体这个术语来自于哲学，根据韦氏词典的解释，本体是形而上学的一个分支。基于本体的搜索引擎的基本设计思想： (1)在领域专家的帮助下，建立相关领域的本体(Ontology)；3.4 基于本体的语义搜索引擎模型简介(OntoSSE,ontology-based Semantic Search Engine) OntoSSE是基...

阅872 转13 评0 公众公开 10-06-10 18:30

MMAnalyzer中文搜索

import org.apache.lucene.analysis.import org.apache.lucene.document.import org.apache.lucene.index.import org.apache.lucene.queryParser.import org.apache.lucene.search.import org.apache.lucene.store.Query query = parser.parse("印度尼西亚 6.2级地震");//检索词 Hits hits = isearcher.search(query); System.out.pr...

阅2345 转14 评0 公众公开 10-05-23 10:00

（一）SVM的八股简介。正是因为SVM关注的是VC维，后面我们可以看到，SVM解决问题的时候，和样本的维数是无关的（甚至样本是上万维的都可以，这使得SVM很适合用来解决文本分类的问题，当然，有这样的能力也因为引入了核函数）。小样本，并不是说样本的绝对数量少（实际上，对任何算法来说，更多的样本几乎总是能带来更好的效果），而是说与问题...

阅19 转自funson 公众公开 10-05-11 13:27

针对数字ocr的识别,特征向量的选取就非常的重要。由于是对ocr和libsvm的尝试,所以我的训练使用的是手写的图片，拖动鼠标，在picturbox控件上画的数字图片,既能训练,也能用来识别。样本数据保存在数据库中，需要识别的时候载入数据库的样本数据训练该分类识别器。简单的把该图片分成16*16网格, 每个网格的特征向量值:黑色的像素点/总的像素点,每...

阅82 转自duduwolf 公众公开 10-05-11 11:31

用于车牌字符识别的SVM算法。传统的字符识别方法，如模板匹配、神经网络等，在进行车牌字符识别时其识别率很大程度上依赖于训练样本的数量，且在无特征提取的情况下，识别的正确率相对较低。本文的识别系统识别34个汉字需要建立34个二分类器，为提高识别速度，降低识别系统的复杂度，输入字符不进行特征提取，将16*16的字符矩阵转换成256维的向...

阅123 转自superlee 公众公开 10-05-11 11:30

经典的支持向量机算法只给出了二类分类的算法，而在数据挖掘的实际应用中，一般要解决多类的分类问题。支持向量机是基于统计学习理论的新一代学习机器，具有很多吸引人的特点，它在函数表达能力、推广能力和学习效率上都要优于传统的人工神经网络，在实际应用中也解决了许多问题，但由于SVM的出现比较晚，还处于发展阶段，尤其是其算法实现方面...

阅7 转自superlee 公众公开 10-05-11 11:29

关于数据挖掘中的聚类分析聚类　　数据库中的记录可被化分为一系列有意义的子集，即聚类。除了输入层的节点，神经网络的每个节点都与很多它前面的节点（称为此节点的输入节点）连接在一起，每个连接对应一个权重Wxy，此节点的值就是通过它所有输入节点的值与对应连接权重乘积的和作为一个函数的输入而得到，我们把这个函数称为活动函数或挤压...

阅760 转自123#￥公众公开 10-05-11 11:26

他的文章
他的书籍

筛选

不限类型

网文

撰写

文档

不限 Word PPT Excel RTF PDF TXT

思维导图

相册

音乐

视频

显示摘要不显示摘要

每页10条每页30条每页50条

返回
顶部