Oracle Text是Oracle数据库的一个组件,提供了强大的全文检索功能。自Oracle 7.3起,Oracle就开始支持全文检索,允许用户使用基于文本的查询。Oracle Text的应用领域非常广泛,包括:
- 搜索文本:需要快捷有效搜索文本数据的应用程序。
- 管理多种文档:允许搜索各种混合文档格式的应用程序,包括ord、excel、lotus等。
- 从多种数据源中检索文本:不仅来自Oracle数据库中的文本数据,还可以来自Internet和文件系统的文本数据。
- 搜索XML应用程序。
在使用Oracle Text之前,需要先在文本列上建立索引。Oracle Text索引被称为域索引(domain index),包括4种索引类型:CONTEXT、CTXCAT、CTXRULE、CTXXPATH。每种索引类型都有其特点和应用场景。
- CONTEXT索引:最常用的索引类型,支持多种数据格式,支持中文字符集,支持分区索引,唯一支持并行创建索引(Parallel indexing)。对表进行DML操作后,并不会自动同步索引,需要手工同步索引。
- CTXCAT索引:适合于查询较小的具有一定结构的文本段,具有事务性,当更新主表的时候自动同步索引。