kafka的了解

技术2023-05-08 102

1.Kafka的特点

1.解耦：　　允许你独⽴的扩展或修改两边的处理过程，只要确保它们遵守同样的接⼝约束。 2.冗余：　　消息队列把数据进⾏持久化直到它们已经被完全处理，通过这⼀⽅式规避了数据丢失⻛险。许多消息队列所采⽤的"插⼊-获取-删除"范式中，在把⼀个消息从队列中删除之前，需要你的处理系统明确的指出该消息已经被处理完毕，从⽽确保你的数据被安全的保存直到你使⽤完毕。 3.扩展性：　　因为消息队列解耦了你的处理过程，所以增⼤消息⼊队和处理的频率是很容易的，只要另外增加处理过程即可。 4.灵活性 & 峰值处理能⼒：　　在访问量剧增的情况下，应⽤仍然需要继续发挥作⽤，但是这样的突发流量并不常⻅。如果为以能处理这类峰值访问为标准来投⼊资源随时待命⽆疑是巨⼤的浪费。使⽤消息队列能够使关键组件顶住突发的访问压⼒，⽽不会因为突发的超负荷的请求⽽完全崩溃。 5.可恢复性：　　系统的⼀部分组件失效时，不会影响到整个系统。消息队列降低了进程间的耦合度，所以即使⼀个处理消息的进程挂掉，加⼊队列中的消息仍然可以在系统恢复后被处理。 6.顺序保证：　　在⼤多使⽤场景下，数据处理的顺序都很重要。⼤部分消息队列本来就是排序的，并且能保证数据会按照特定的顺序来处理。（Kafka 保证⼀个 Partition 内的消息的有序性） 7.缓冲：　　有助于控制和优化数据流经过系统的速度，解决⽣产消息和消费消息的处理速度不⼀致的情况。 8.异步通信：　　很多时候，⽤户不想也不需要⽴即处理消息。消息队列提供了异步处理机制，允许⽤户把⼀个消息放⼊队列，但并不⽴即处理它。想向队列中放⼊多少消息就放多少，然后在需要的时候再去处理它们。

2.Kafka架构图

3.Kafka相关概念

1.producer：　　消息⽣产者，发布消息到 kafka 集群的终端或服务。 2.broker：　　kafka 集群中安装Kafka的服务器。 3.topic：　　每条发布到 kafka 集群的消息属于的类别，即 kafka 是⾯向 topic 的(相当于数据库中的表) 4.partition：　　partition 是物理上的概念，每个 topic 包含⼀个或多个 partition。kafka 分配的单位是 partition。 5.consumer：　　从 kafka 集群中消费消息的终端或服务。 6.Consumer group：　　high-level consumer API 中，每个 consumer 都属于⼀个 consumer group，每条消息只能被 consumer group 中的⼀个 Consumer 消费，但可以被多个 consumer group 消费。 7.replica：　　partition 的副本，保障 partition 的⾼可⽤。 8.leader：　　replica 中的⼀个⻆⾊， producer 和 consumer 只跟 leader 交互。 9.follower：　　replica 中的⼀个⻆⾊，从 leader 中复制数据。 10.zookeeper：　　kafka 通过 zookeeper 来存储集群的 meta 信息

Processed: 0.012, SQL: 9