Kafka中的消费者通常属于某个消费者群组,多个群组可以同时读取同一个主题而互不干扰。引入消费者群组的概念是为了应对消费者可能执行高延迟操作的情况,例如将数据写入数据库或HDFS,或进行耗时计算。

单个消费者在面对高速数据生成时可能难以招架,此时可以通过增加消费者数量来分担负载,每个消费者负责处理部分分区的消息。这种策略是Kafka实现横向伸缩的关键机制。