神舟AVIDM全文检索                                                            ( 返回 )

1、问题与挑战

    目前,用户单位的AVIDM系统中积累了大量的科研文档,这些文档是用户单位的宝贵经验和财富。如何利用好这些大量的科研文档,是摆在各企业信息化人员面前,急需解决的问题之一。
    利用AVIDM全文检索功能,可以对AVIDM系统中的文档内容进行“地毯式”检索,在提高文档检索效率的同时,进一步提高对已有文档资源的利用率。
    众所周知,随着计算机产业的发展,以计算机存储设备为载体的电子信息愈来愈多,这些信息大致可分为两类:结构化数据和非结构化数据,结构化数据指的是诸如企业财务帐目和生产数据等等,非结构化数据的则是一些word文件、pdf文件等等。据不完全统计,非结构化数据占据整个企业信息量的80%以上,因此如何有效利用好非结构化数据,是提高企业整体效率的关键因素之一。 对于结构化数据,用RDBMS(关系数据库管理系统)技术来管理是目前最好的一种方式。但是由于RDBMS自身底层结构的缘故使得它管理大量非结构化数据显得有些先天不足,特别是查询这些海量非结构化数据的速度较慢。而通过全文检索技术就能高效地管理这些非结构化数据。

2、 AVIDM全文检索特点

    AVIDM全文检索的特点是:准确、快速、海量。

2.1 先进的系统架构

  • AVIDM全文检索系统是一套基于纯Java技术设计和开发的全文检索系统;能够运行在各个操作系统平台和Java应用服务器上,完全遵从J2EE的标准;
  • AVIDM全文检索采用oracle的全文检索技术,具有强大的文本检索能力和智能化的文本管理能力。

2.2 强大的检索功能   

  • 性能优化,海量数据的即时响应
  • 对于1-10万份文档,其查询的时间控制在10秒内。
  • 支持word、excel等常用格式文档。
  • 支持特大数据量,并且有很好的可扩展性。
2.3 灵活的检索条件

  • 根据用户请求的具体页面,设置关联的关键字,支持多关键字组合搜索、模糊搜索,支持搜索内容的关联显示,使得用户能够以最快的速度获得准确的信息。
  • 当用户需要通过多个关键字对文档内容进行检索查询时,只需要键入以空格分开的多个关键字即可。
  • 除了支持对文档内容的全文检索,还可以对文档标题、作者、时间、型号、专业等文档属性进行常规检索。

2.4 丰富的检索显示  

  • 支持相关度排序、时间排序以及组合排序。支持对检索的多种处理手段,特别是提供了对检索结果的多字段  (含标题) 联合排序功能。
  • 对于符合检索条件的AVIDM文档,均予以显示。考虑到全文检索结果的条目数量可能比较庞大,检索结果提供翻页功能,每页显示10条查询结果。

2.5 集成的安全访问机制

  • 从资源的利用角度,无论当前用户是否具有对此文档的访问权限,其都可以依照一定的条件检索出该文档的条目(内容无法看到),以保证其可以充分利用系统内资源。
  • 对于通过全文检索在AVIDM中检索出来的文档,系统自动根据AVIDM权限设置进行判断,操作者只有具有此文档的访问权时,才可以打开此文档。反之,系统提示操作者“不具有打开此文档的权限”。从而保证正确的人看到正确的信息。这个是其他检索产品所不能替代的。
  • 对于其没有访问权限的文档,如果工作需要,可以通过申请权限的方式,获得该资源的访问权。但前提是“必须能通过全文检索,知道有此文档的存在”。

2.6 良好的操作界面

    操作界面采用类似google、百度的简明风格,即以一个输入框和一个按钮为全部操作元素,达到了极好的用户操作性能。
    图表1 为对一个关键字进行查询的结果;图表2为对多个关键字组合查询的结果。
    组合查询的方式为:在每个关键字之间加上空格即可。用户可以通过组合查询,逐步缩小查询的范围,达到快速定位的目的。

图表1 单个关键字的查询

图表 2 多个关键字的组合查询

3环境配置要求

    服务器

    AVIDM全文检索服务器建议的运行环境要求为:
    Windows 2000/2003/XP 操作系统
    P4以上CPU
    512M以上内存
    2G以上空余磁盘空间
    AVIDM全文检索作为纯JAVA的应用系统,亦可在LINUX、UNIX等系统上运行;系统自带的应用服务器为Tomcat,同时AVIDM报表中心亦可以在其他应用服务器环境下运行。具体事宜请向北京神舟软件公司咨询。
    AVIDM全文检索运行时不需要使用单独的数据库。

    客户端

    AVIDM全文检索对客户端无任何特别要求,用户可通过任何浏览器访问AVIDM全文检索功能。