KAFKA

    技术2022-08-01  79

    KAFKA 的TOPIC __consumer_offsets 的清理

    生产环境因kafka日志数据量过大,导致磁盘空间占用满了,通过查看发现kafka的日志储存目录kafkadata占用90%的存储。 再进一步查找,发现目录下好多__consumer_offsets 生成的储存文件,每个文件1GB。 查找了一下kafka配置,发现kafka对部分topic的清理策略做了特殊处理,所以导致我们自己配置的清理策略未生效。

    查看现有的__consumer_offsets 清理策略

    ./kafka-configs.sh --zookeeper es01:2181,es02:2181,es03:2181 --entity-type topics --entity-name __consumer_offsets --describe

    打印结果如下:

    Configs for topic '__consumer_offsets' are segment.bytes=104857600,cleanup.policy=compact,compression.type=producer

    删除特有的清理策略

    ./kafka-configs.sh --zookeeper es01:2181,es02:2181,es03:2181 --entity-type topics --entity-name __consumer_offsets --alter --delete-config cleanup.policy

    网上的资料都说 ,删除掉__consumer_offsets的特殊的清理策略后,默认会使用我们配置文件的清理策略。(对此我未做验证)

    但为了保险我还是给__consumer_offsets 手动添加了清理策略:

    ./kafka-configs.sh --zookeeper es01:2181,es02:2181,es03:2181 --alter --entity-name __consumer_offsets --entity-type topics --add-config retention.ms=86400000 ./kafka-configs.sh --zookeeper es01:2181,es02:2181,es03:2181 --alter --entity-name __consumer_offsets --entity-type topics --add-config cleanup.policy=delete ./kafka-configs.sh --zookeeper es01:2181,es02:2181,es03:2181 --alter --entity-name __consumer_offsets --entity-type topics --add-config 'max.message.bytes=50000000' --add-config 'flush.messages=50000'

    添加完后,等了一会就发现kafka的日志目录大小已经减少很多了,最终磁盘使用率有90%降到了30%,一次生产磁盘危机就此解决了。

    Processed: 0.010, SQL: 9