Seeker 实现了一个搜索引擎,采用 Apache Nutch 抓取指定域名的网页,并通过 Apache Hadoop 构建倒排索引。利用 MongoDB 数据库存储数据和索引,提升响应速度和扩展性。该系统采用 REST Web 服务与部署在 Apache Tomcat 服务器上的 Web 应用程序通信。网页排名依据 TF-IDF 算法和链接分析算法确定。