MetaSeeker是一个网页抓取、数据抽取和页面信息提取工具包,能够根据用户指导从Web页面中提取所需信息,并生成含有语义结构的XML提取结果文件。Web页面显示信息为人类阅读设计,而对机器而言却是无结构的。MetaSeeker解决了这一难题,将无结构的Web页面信息转化为适合机器处理的结构化信息。它广泛应用于专业搜索、Mashup和Web数据挖掘领域。MetaStudio是一款Web页面信息结构描述工具,提供GUI界面,并作为Firefox扩展发布。建议与MetaCamp和DataStore配套使用,以便上传信息结构描述文件和各种信息提取指令文件到MetaCamp和DataStore服务器,实现协同描述页面信息结构和分享信息提取成果的功能。