第 10 章
管理搜索引擎服务
本章介绍如何配置和管理 Sun Java? System Portal Server 搜索引擎服务。
本章包含以下部分:
搜索引擎服务概述
Sun Java System Portal Server 搜索引擎是一种分类法和数据库服务,旨在支持搜索和浏览与流行的 Internet 搜索引擎(如 Google、Alta Vista 等)类似的界面。搜索引擎包括一个 robot,用以发现、转换和汇总文档资源。在 Sun Java System Portal Server 6 2004Q2 中,该界面是由桌面使用 JSP? 提供者专门提供的。搜索引擎包括用于配置编辑的管理工具和用于管理系统的命令行工具。可以通过 Sun Java? System Identity Server 管理控制台,定义配置设置并将其存储为 Sun Java System Identity Server 服务属性值。
|
注
|
虽然管理控制台允许管理员对大多数的搜索引擎选项进行配置,但它不会执行所有通过命令行可执行的管理功能。
|
|
搜索数据库
搜索用户在数据库中搜索,以查找特殊资源或资源种类。数据库中的各个条目被称为资源描述 (RD)。“资源描述”是关于某个单一资源的特定信息集合。每个“资源描述”的字段由数据库模式决定。
要将 RD 放入数据库中,可以使用两种方法:
- 创建 RD — 这是目前最常用的方法,它使用 robot 进程查找资源,然后生成它们的描述。
- 交换 RD — 这种方法适用于为大型分布式网络创建索引。远程系统生成 RD,然后搜索引擎将这些 RD 导入到其数据库中。
“Sun Java System Portal Server 搜索引擎”中的 RD 基于开放式的 Internet 标准,例如 “摘要对象交互格式”(SOIF) 和资源描述消息 (RDM)。它确保了搜索引擎可以在跨平台企业环境中运行。
搜索 Robot
填写数据库的方法之一是通过 robot。“搜索引擎”使用 robot 对它们域中的资源进行查找并报告。robot 是一个小程序,它可以完成以下两个任务:
系统管理员应通过多种方法对这些进程的各个方面进行控制,包括以下方面:
- 通过启动、停止以及制定 robot 进度表来控制 robot 何时运行。
- 通过定义 robot 访问的站点来控制 robot 查找资源的位置。
- 通过定义搜寻属性来控制搜索的深度。
- 通过定义过滤器控制 robot 为哪类资源创建索引。
- 通过定义索引属性控制其为数据库创建的条目种类。
搜索引擎还提供了实用程序,以确保 robot 完成所需任务。
数据库分类法类别
用户以两种完全不同的方式与搜索系统进行交互:可以键入直接查询来搜索数据库,也可使用一组您设计的类别来浏览整个数据库内容。类别的层次结构有时也称为分类法。对资源进行分类如同为数据库创建一个目录一样。
在搜索系统中,浏览是一个可选功能。也就是说,一个非常有用的搜索系统可以不包括按类别浏览功能。您需要决定添加可浏览的类别是否对您的索引的用户有用,然后决定您要创建何种类别。
“搜索”数据库中的资源被分配给各个类别,以简化其复杂程度。如果数据库中存在大量项目,则最好将相关项目组合在一起。这样使用户能够快速找到特定类型的项目、对类似的项目进行比较,以及选择所需的项目。
这是在产品和服务索引中是常用的分类方法。服装目录可分为男装、女装和童装,每一类又可进一步分为外套、衬衫、鞋等等。办公产品目录可分为办公用家具、文具、计算机、软件。广告目录按照产品和服务的类别进行安排。
指南中索引的分类原则也适用于联机索引。这种方法使用户能够很容易地找到某类资源,从而可以选择所需的资源。无论您设计的索引的范围如何,在类别的设置中主要都应考虑可用性。也就是说,您需要了解用户将如何使用这些类别。例如,如果您为某公司设计索引,而该公司有三个不同地点的办事处,则可将顶级类别与这三个办事处中的每一个相对应。但是假如用户对超越地理界限的职能部门更感兴趣,则按照公司部门对资源进行分类也许更有意义。
一旦定义了类别,就必须制定出将资源分配给各个类别的相应规则。这些规则被称为分类规则。如果没有正确定义分类规则,则用户将不能通过在类别中浏览来找到资源。必须避免对资源进行错误的分类,但也不应根本不对文档进行分类。
可以将这些文档分配给多个类别,最多可达到设置中定义的最大值。分类规则比过滤器规则简单,因为它们不涉及任何流程控制决策。在这些分类规则中,您必须决定使用什么样的标准将特定的类别分配给资源,作为其“资源描述”的一部分。分类规则是一个简单的条件语句,采用“如果 <某条件> 为真,则将资源分配给 <类别>”的格式。
配置搜索频道
本部分介绍如何对搜索引擎服务进行初始配置。可以通过 Sun Java System Identity Server 管理控制台,定义配置设置并将其存储为 Sun Java System Identity Server 服务属性值。
“搜索”服务会在全局范围内进行注册,其配置适用于整个 Portal Server。默认情况下,在 Sun Java System Portal Server 安装期间指定的组织将会注册搜索服务。如果安装了示例门户,示例门户桌面上的“搜索”选项卡包含搜索频道。在 Sun Java System Portal Server 安装期间,会配置此项。但是,对于新组织和新实例,必须定义“搜索 URL”。
对搜索提供者用户的默认操作是,当用户输入一条查询时,显示“未找到匹配文档”。
这时,需要配置搜索服务器并创建文档数据库,以获得搜索结果。
初始配置搜索服务器
使用以下步骤配置搜索提供者。这是填写数据库的示例方法。也可以使用导入功能。
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 创建一个新站点。
- 单击 Robot。
- 单击“站点”。
- 单击“管理站点”下的“新建”,为 Robot 定义要创建索引的站点。
- 指定站点类型(URL 或域)、要创建索引的站点和 robot 搜寻的深度。
- 单击“创建站点”以使用默认“搜索”属性,或者选择“创建并编辑站点”来更完整地定义搜索站点。
有关定义站点的那些属性的详细信息,参见附录 F,“搜索属性”。
- 创建分类法。
可以使用“类别”下的“类别编辑器”,或者通过将示例分类法 SOIF 文件复制到 config/taxonomy.rdm 下,来创建一个分类法。
- 禁用所有不需要使用的默认过滤器。
单击 Robot,再单击“过滤器”。关闭“过滤器规则”列表中的所有不想使用的过滤器。
- (可选项)如果需要在类别下得到文档结果,则创建 robot 分类规则。
通过使用“类别”下的“分类规则编辑器”,可以创建一个 robot 分类规则。
- 启动 robot。
单击 Robot、“概述”,然后单击“启动”,启动 robot。
- 重建类别索引
单击“类别”,然后单击“重建索引”来重新创建索引。
定义搜索 URL
searchServer 特性定义 搜索 URL。此项会自动为默认组织配置,但是,当创建了新组织、新 SearchProvider 实例,或者手动加载了示例 dp-org.xml 时,不会定义此值。如果在未定义此值时用户进行搜索,则用户的桌面上会显示下列错误消息:
您收到 com.sun.portal.search.providers.taglib.SearchTaglibExceptionSearchRequest 错误:未定义搜索服务器。
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 选择要定义搜索 URL 的组织。
- 在“查看”菜单中选择“服务”
使用导航窗格中的“显示”菜单和位置窗格中的“位置”路径。
- 在导航窗格中单击“桌面”旁的特性箭头。
桌面属性页出现在数据窗格中。
- 在桌面页中,单击“频道和容器管理”链接。
显示“频道”页面。容器路径位于顶部。已定义的频道出现在列表中。
- 单击要修改的“搜索”频道旁的“编辑特性”链接。
显示“特性”页面。
- 在“搜索服务器”特性中按以下格式指定搜索 URL:
http://portal_server_name:port/portal/search
- 单击“保存”。
- 要验证“搜索 URL”,请执行下列操作:
- 登录到已配置了“搜索 URL”的组织。例如,按以下格式登录到一个名为 B 的组织:
http://portal_server_name:port/amserver/ui/login?org=B
- 通过搜索频道执行搜索。
管理搜索引擎
一旦已经初始配置了“搜索引擎”并生成了一个数据库,就可以通过 Sun Java System Identity Server 管理控制台查看和管理“搜索引擎”。
查看、管理及监视搜索引擎操作
搜索引擎操作属性有两个级别:基本和高级。当从管理控制台中选择“搜索”服务后,默认情况下会显示基本设置页面。显示出的基本设置包括服务器根目录、临时文件的位置以及文档级安全。高级设置包括各种搜索引擎组件的日志位置和配置的日志级别。
此外,管理控制台允许管理员查看日志文件或从日志文件中提取的特定信息。
查看或管理基本设置
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,单击“服务器”,然后单击“设置”。
- 查看或指定搜索引擎的“服务器根”目录。
- 查看或指定搜索引擎的“临时文件”目录。
- 查看或指定“文档级安全”属性。
“关”表明所有用户都可以访问数据库中的 RD。“开”表示必须对 RD 中的 ReadACL 字段求值,以决定用户是否有权访问 RD。
- 单击“保存”,记录所有更改的属性。
查看或管理高级设置
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,单击“服务器”,然后单击“高级”。
- 查看或指定“高级”属性
可用属性包括:“搜索”(rdm)、“禁用搜索日志”、“索引维护”、“RD 管理器”、“RDM 服务器”和“日志级别”。
- 单击“保存”,记录所有更改的设置。
监视搜索引擎活动
“搜索引擎”提供了大量的报告,允许您监视搜索操作。
要查看各种报告:
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 单击“报告”。
- 单击菜单栏中的某个链接,以查看某个特定报告。
以下是可以使用的报告选项:“启动点”、“已排除的 URL”、“Robot 高级报告”、“日志文件”和“流行的搜索”。
管理 Robot
以下是一些管理 robot 可能需要完成的配置和维护任务:
定义站点
Robot 查找资源并决定是否(及如何)将这些资源的描述添加到数据库中。决定要访问哪个服务器以及要为这些服务器的哪些部分创建索引的过程称为站点定义。
为搜索引擎定义站点是服务器管理员的最重要的工作之一。必须确保将 robot 发送给所有需要创建索引的服务器,但也需要排除那些能够填写数据库的无关站点,这些站点增加了查找正确信息的难度。
定义 Robot 要创建索引的站点
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,单击 Robot,然后单击“站点”。
- 要创建一个站点:
- 单击“新建”。
- 选择站点的类型(url 或域)。
- 指定站点和深度。
- 单击“保存”。
- 要编辑站点属性,请单击“编辑”链接。
此操作会显示一个包含站点属性的窗体。有关“站点”属性的信息,参见附录 F,“搜索属性”。
控制 Robot 搜寻
Robot 对所选择的要创建索引的各个站点进行搜寻。管理员可以控制 robot 搜索站点的方式,方法是定义搜寻操作参数。搜寻参数允许您定义速度、完成操作、记录级别、符合的标准、验证参数、代理设置、要跟随链接的最大数目及其他设置。有关 Robot 搜寻属性的说明,参见附录 F,“搜索属性”。
控制 Robot 搜寻
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中单击 Robot,然后单击“搜寻”。
此操作会显示一个窗体,其中包含定义“Robot 搜寻”操作参数及其设置的属性。有关“Robot 搜寻”属性的信息,参见附录 F,“搜索属性”。
- 根据需要修改“Robot 搜寻”属性。
|
注
|
如果 jvm12.conf 文件中已经设置了代理(使用 http.proxyHost= 和 http.proxyPort= 选项),则必须选中“从任一主机接受命令”才能使 Robot 运行。
|
|
- 单击“保存”。
过滤 Robot 数据
过滤器允许将某个资源的属性与过滤器的定义进行比较,以此来确定一个资源,从而可以利用“站点”定义排除或包括该资源。Robot 带有一些预定义的过滤器,在默认情况下会启用其中的某些过滤器。下列过滤器是预定义的;默认情况下会启用带星号的文件。
要管理过滤进程,可以创建新过滤器定义、修改某个过滤器定义,或者启用或禁用过滤器。
创建新过滤器定义
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,选择 Robot,然后选择“过滤器”。
- 单击“新建”,并为新过滤器指定一个“昵称”。
- “过滤器定义”中,选中复选框并指定“过滤源”、“过滤条件”和“过滤字符串”值。可根据需要指定“过滤器定义”的数量。
- 输入过滤器说明。
- 如果要在创建新站点时使用此过滤器,请选中“新站点”。
- 单击相应按钮,以指明是要包括还是要排除与此过滤器相匹配的资源。
- 单击“保存”。
修改现有过滤器定义
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,选择 Robot,然后选择“过滤器”。
- 在“过滤器规则”列表中找到要修改的“过滤器”,单击“编辑”链接。
- 根据需要修改“过滤器”。
- 输入过滤器说明。
- 单击“保存”。
启用或禁用过滤器
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,选择 Robot,然后选择“过滤器”。
- 在“过滤器规则”列表中找到要修改的“过滤器”。
- 选择相应按钮,以指明要关闭还是打开过滤器。
- 单击“保存”。
定义索引属性
对于通过 robot 过滤器的每种资源,robot 会在数据库中生成一个 RD。设置 RD 的生成时所做的选择决定了用户搜索数据库时看到的内容。例如,可以选择为每个文档的全部文本创建索引,或者仅为文档开头的某些固定部分创建索引。
定义索引属性:
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,选择 Robot,然后选择“索引”。
此操作会显示页面,其中包含定义“Robot 索引”操作参数及其设置的属性。有关“Robot 索引”属性的信息,参见附录 F,“搜索属性”。
- 根据需要修改“Robot 索引”属性。
- 单击“保存”。
使用 Robot 实用程序
Robot 包含两个调试工具或实用程序:
- 站点探测器 — 检查 DNS 别名、服务器重定向、虚拟服务器等等。
- 模拟器 — 在一个 URL 上执行 robot 过滤的部分模拟。键入一个或多个 URL 进行检查,并选择“确定”。模拟器会指示 robot 是否接受所列出的站点。
运行站点探测器实用程序
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,选择 Robot,然后选择“站点探测器”。
- 输入要探测的站点的 URL。
- 如果希望探测器返回 DNS 信息,请单击“显示高级 DNS 信息”。
- 单击“确定”启动“站点探测器”。
运行模拟器
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,选择 Robot,然后选择“模拟器”。
- 键入一个或多个要执行模拟的 URL。
- 如果希望“模拟器”检查别名,请选择“检查 DNS 别名”。
- 如果希望“模拟器”检查重定向,请选择“检查服务器重定向”(302)。
- 单击“确定”启动“模拟器”。
制定 Robot 进度表
为确保及时搜索数据,robot 应定期搜索站点并为站点创建索引。Robot 搜寻和创建索引可能消耗处理资源和网络带宽。为避免这些资源限制,应将 robot 安排在非使用高峰期运行。管理控制台允许管理员设置一个 cron 作业,它带有运行 robot 的日期和时间。
制定 Robot 进度表
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,选择 Robot,然后选择“进度表”。
- 选择启动 robot 的时间(小时和分钟)和日期。
- 选择停止 robot 的时间和日期。
- 单击“保存”。
管理数据库
“搜索引擎”将其资源描述存储在一个数据库中。以下是管理数据库时可能需要执行的一些配置和维护任务:
导入数据库
通常,“搜索”数据库中的项目来自 robot。告知 robot 要访问哪个站点,然后 robot 会查找并描述在此站点找到的所有资源。但是也可以从其他 Sun Java System Portal Server“搜索引擎”、iPlanet Web Servers 或 Netscape? Enterprise Servers 或者由其他资源生成的数据库中导入现有数据库的项目。导入现有数据库的 RD 而非发送 robot 来重新创建,这将有助于减少网络流量,而且通过将工作量分成多个较小的部分,还能更迅速地完成大量的索引创建工作。如果中央数据库距离要被索引的服务器很远,则最好在本地生成 RD,然后在中央数据库中定期导入各种远程数据库。
搜索引擎使用导入代理从其他服务器或数据库导入 RD。导入代理是一个进程,它从外部资源中检索若干 RD,并将这些信息合并到本地数据库中。其中包含一些参数,指示此代理导入 RD 的位置,到达此位置后的请求目标,以及调整作业处理方式的一些其他信息。
在导入数据库前,必须创建导入代理。创建代理后,可以立即启动导入进程或者安排运行导入进程的时间。
创建导入代理
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 选择“数据库”,然后单击“导入代理”链接。
- 单击“新建”。
出现导入代理的属性页面。
- 为导入代理指定相应的属性。
有关“数据库导入”属性的信息,参见附录 F,“搜索属性”。
- 指出导入源是本地文件还是搜索服务器。
- 如果导入源是一个文件,请指定本地文件路径。
- 如果导入源是其他搜索服务器,请指定远程服务器的 URL、实例名和搜索 URI。
- 指定要导入的数据库的名称。
- 为导入代理指定字符集。
- 单击“保存”。
编辑现有的导入代理
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 选择“数据库”,然后单击“导入代理”链接。
- 单击要编辑的代理右侧的“编辑”链接。
- 为导入代理指定相应的属性。
有关“数据库导入”属性的信息,参见附录 F,“搜索属性”。
- 单击“保存”。
编辑资源描述
有时,您会发现必须更改一个或多个“资源描述”的内容。例如,可能需要对从原始文件复制到“资源描述”中的某个错字进行更正。
编辑资源描述
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,选择“数据库”,然后选择“资源描述”。
- 选择要搜索进行编辑的“资源描述”的类型。
可使用以下类型:所有 RD、未分类的 RD、分类的 RD、按类别划分的 RD、按 URL 指定的 RD、包含的 RD。
- 对于包含的“资源描述”,在“资源描述”中指定要搜索的文本串。
- 单击“搜索”。
- 从查找到的“资源描述”列表中,选择要编辑的“资源描述”。
- 编辑相应的“资源描述”属性。
- 单击“保存”。
编辑数据库模式
模式决定“搜索引擎”保持每一资源的何种信息以及保持信息的方式。模式的设计决定影响索引可用性的两个因素:
对于数据库中的“资源描述”,这种模式是一种主数据结构。根据使用这种数据结构定义字段和为字段创建索引的方式,用户将具有不同的资源访问级别。
这种模式与搜索引擎及其 robot 所用的文件结构密切相关。应只使用管理控制台中的模式工具更改此数据结构。即使模式文件 (schema.rdm) 是一个文本文件,也始终不能直接对其编辑。
您可以编辑搜索引擎的数据库模式,来添加新模式属性、编辑模式属性或删除这些属性。
此模式包括下列属性:
- 可编辑 — 如果选中此项,表示属性将显示在“资源描述编辑器”中,因此可以更改它的值。“资源描述编辑器”在编辑资源描述中介绍。
- 可建索引 — 该属性表示字段显示在“高级搜索”屏幕的弹出式菜单中。它允许用户搜索此特定字段中的值。
- 描述 — 这是用来描述模式的文本串。可以将其用于注释或评注。
- 别名 — 该属性允许您定义别名,用来将已导入的数据库模式名称转换成您自己的模式名称。
编辑数据库模式
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,选择“数据库”,然后选择“模式”。
出现模式属性页。
- 在模式中添加新属性:
- 选择“模式列表”下的“新建”。
- 在“名称”和“描述”字段中,为新属性输入名称和描述。
- 选中“可编辑”,允许编辑属性。
- 选中“可建索引”,以便能够为属性建立索引。
- 要使现有的模式属性可编辑或可建索引:
- 单击模式列表中某个属性旁的“编辑”链接。
出现模式属性页。
- 选中“可编辑”,允许编辑属性。
- 选中“可建索引”,以便能够为属性建立索引。
- 单击“更新”
- 要删除某个属性:
- 在模式列表中选中某个属性。
- 单击“删除”。
|
注
|
更改搜索引擎模式可能需要为整个数据库重新建立索引,并重新启动服务器。这是因为搜索引擎的突出显示功能对模式字段的顺序和类型很敏感。添加或删除(或者即使删除后再添加回来)一个文本字段极有可能导致突出显示的搜索结果不正确。
|
|
定义模式别名
在下述情况下,您可能会发现数据库模式中使用的字段名称之间存在差异。一种情况是当您将“资源描述”从一个服务器导入另一个服务器时。您无法始终保证这两个服务器对各自模式中的项目使用相同的名称。同样,当 robot 将某个文档中的 HTML META 标记转换成模式字段时,该文档对这些名称进行控制。
搜索引擎允许您为模式属性定义模式别名,以便将这些外部模式名映射到数据库中的有效字段名。
定义模式别名
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 选择“数据库”,然后单击“模式”链接。
出现模式属性页。
- 单击要定义别名的属性。
- 指定别名的字段名(与在导入数据库中所用的名称相同)。
- 单击“更新”。
- 单击“重建索引”。
对于大型数据库,重建索引的过程可能需要几个小时。
查看数据库分析
“搜索引擎”提供一个报告,该报告包含有关已创建索引的站点数量以及来自数据库中每个站点的资源数量的信息。
查看数据库分析信息
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中,选择“数据库”,然后选择“分析”。
显示包含已排序的所有站点以及当前搜索数据库中该站点的资源数量的列表。
- 要生成最新的列表,请单击“保存”。
重建数据库索引
在某些特殊情况下,可能需要为“搜索引擎”重新建立“资源描述”数据库的索引。一个明显的例子是,编辑了模式来添加或删除已建立索引的字段后,需要执行此操作。
如果磁盘错误破坏了索引文件,也可能需要重建该数据库的索引。在添加了大量新的“资源描述”后,最好也重建索引。
重建数据库索引可能需要几个小时。
重建数据库索引所需的时间与数据库中的记录数成正比,因此,如果是大型数据库,应在服务器处于非需求高峰时进行重建索引。
重建数据库索引
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 选择“数据库”,然后选择“管理”。
- 单击“数据库列表”下的“重建索引”。
- 选中“是否重新建立数据库的索引?”复选框,然后单击“确定”。
搜索引擎重新建立搜索集合及其索引文件。
终止数据库
终止数据库将终止被认为到期的“资源描述”。仅当运行终止程序时,“资源描述”才到期。到期的“资源描述”将被删除,但数据库大小不会减少。
要终止数据库:
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 选择“数据库”,然后选择“管理”。
- 选择“数据库列表”下的“终止”。
- 选中“终止 RD?”复选框,然后单击“确定”。
清除数据库
“资源描述”的属性之一是其到期日期。Robot 可以通过 HTML META 标记或通过资源服务器提供的信息设置到期日期。除非资源指定了不同的到期日期,否则“资源描述”的到期日期默认为自创建之日起三个月后。搜索引擎会从其数据库中定期清除到期的“资源描述”。
清除操作允许您删除数据库的内容。索引使用的磁盘空间将被恢复,但主数据库使用的磁盘空间不会被恢复,而是在将新数据添加到数据库中时重新使用。
清除服务器中到期的资源描述:
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 选择“数据库”,然后选择“管理”。
- 选择“数据库列表”下的“清除”。
- 选中“是否清除数据库?”复选框,然后单击“确定”。
完成清除操作后,系统显示如下消息:“成功清除数据库内容”。
将数据库分区
搜索引擎允许您将包含搜索数据库的物理文件划分到多个磁盘、文件系统、目录或分区中。通过将数据库分布到不同的物理或逻辑设备上,就可以创建一个比能在单个设备上创建的数据库更大的数据库。
默认情况下,搜索引擎将数据库设置为仅使用一个目录。命令行界面允许您对数据库分区执行两种操作:
搜索引擎不执行任何检查操作来确保单个分区有剩余空间。而是由您负责为数据库保持足够的可用空间。
添加新数据库分区的最大总数为 15 个。
|
注
|
增加分区数后,如果以后想再减少此数目,则必须删除整个数据库。
|
|
可通过指定新位置的名称来更改任意数据库分区的物理位置。同样,可以重新命名现有分区。使用 rdmgr 命令来处理分区。有关 rdmgr 命令的信息,参见第 21 章,“命令行实用程序”。
管理数据库分类法
以下是管理数据库分类法可能需要执行的一些配置和维护任务:
配置类别
使用 Sun Java System Identity Server 管理控制台可以执行下列程序,来配置数据库分类法:
创建子类别
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中选择“类别”,然后选择“类别编辑器”。
- 选择一个要在其中创建子类别的类别。
如果事先没有定义任何类别,将只列出标题为“搜索”的根类别。单击下一层“搜索”链接来展开根类别。
- 在“名称”字段中,为该类别指定名称。
- 在“说明”字段中,为该类别指定说明(可选项)。
- 单击“作为子项添加”以创建类别。
- 单击“保存”。
|
注
|
只要可见类别的列表跨越多个页面,“类别编辑器”就会显示一个转到列表。使用上翻和下翻按钮可以从当前页向上或向下滚动一页。使用转到按钮可以访问多个页面。
|
|
创建同级类别
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中选择“类别”,然后选择“类别编辑器”。
- 选择一个要创建同级项的类别。
- 在“名称”字段中,为该类别指定名称。
- 在“说明”字段中,为该类别指定说明(可选项)。
- 单击“作为同级项添加”以创建类别。
- 单击“保存”。
|
注
|
只要可见类别的列表跨越多个页面,“类别编辑器”就会显示一个转到列表。使用上翻和下翻按钮可以从当前页向上或向下滚动一页。使用转到按钮可以访问多个页面。
|
|
更新类别
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中选择“类别”,然后选择“类别编辑器”。
- 选择要更新的类别。
- 要更改类别名称,请在“名称”字段中为该类别指定新名称。
- 要更改类别说明,请在“说明”字段中为该类别指定说明。
- 单击“更新”。
- 单击“保存”。
|
注
|
只要可见类别的列表跨越多个页面,“类别编辑器”就会显示一个转到列表。使用上翻和下翻按钮可以从当前页向上或向下滚动一页。使用转到按钮可以访问多个页面。
|
|
删除类别
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中选择“类别”,然后选择“类别编辑器”。
- 选择要删除的类别。
当某个类别被删除时,它的所有子类别也将被删除。
- 单击“删除”。
- 单击“保存”。
|
注
|
只要可见类别的列表跨越多个页面,“类别编辑器”就会显示一个转到列表。使用上翻和下翻按钮可以从当前页向上或向下滚动一页。使用转到按钮可以访问多个页面。
|
|
定义分类规则
分类规则是一个简单的条件语句。其形式为“如果 <某条件> 为真,则将资源分配给 <类别>”。
定义分类规则
- 以管理员身份登录到 Sun Java System Identity Server 管理控制台。
默认情况下,位置窗格中的“身份认证管理”处于选中状态,导航窗格中会显示所有已创建的组织。
- 在位置窗格中选择“服务配置”。
- 在导航窗格中单击搜索旁的特性箭头。
- 在菜单栏中选择“类别”,然后选择“分类规则编辑器”。
- 如果要创建新规则,请单击“新建”。
- 如果要编辑现有规则,请选择此规则。
- 在下拉菜单中,单击要用来将资源分类的元素类型或属性。
- 单击下拉菜单中的“比较测试”。
可用的对照测试有:是、包含、起始字符、结束字符或正则表达式。
- 定义要比较的文本字符串。
- 如果比较结果为真,则单击要在其中对资源分类的类别。
- 单击“保存”。
版权所有 2004 Sun Microsystems, Inc. 保留所有权利。
|