在互联网行业,Hadoop已经成为大数据处理的关键工具。阿里巴巴利用Hadoop处理商业数据并优化ISEARCH搜索引擎,服务器集群包括15台机器,每台配备8核CPU、16G内存和1.4T硬盘容量。百度使用Hadoop进行日志分析和网页数据库数据挖掘,集群规模从10到500个节点,处理的周数据量达到3000TB。Facebook则利用Hadoop存储内部日志,主要有两个集群,分别包含1100台和300台节点,支持数据挖掘和日志统计。Twitter和雅虎也分别应用Hadoop存储微博数据、日志文件和支持广告系统及网页搜索。