kafka相关必须掌握概念
1.Kafka 的核心架构组件有哪些?各自的作用是什么? 2. Kafka 的主题(Topic)、分区(Partition)、副本(Replica)的关系是什么? 3. 为什么 Kafka 要设计分区?分区的作用有哪些? 4. Kafka 的副本机制原理是什么?ISR 副本集的作用? 5. Kafka 的 Leader 副本和 Follower 副本的职责区别?Follower 同步失败会怎样? 6. Kafka 的生产者(Producer)发送消息的流程是什么? 7. Kafka 生产者的 ACK 机制(0、1、-1/all)分别代表什么?各自的可靠性和性能特点? 8. Kafka 生产者如何保证消息有序?分区内有序和全局有序的实现方式? 9. Kafka 生产者如何解决消息重复发送的问题?幂等性和事务的区别? 10. Kafka 消费者(Consumer)的消费模式有哪些?消费者组(Consumer Group)的作用? 11. Kafka 的 offset 是什么?offset 的提交方式(自动 / 手动)及优缺点? 12. 如何解决 Kafka 消费过程中的重复消费和漏消费问题? 13. Kafka 的消费者 Rebalance 机制是什么?触发条件有哪些?如何避免 Rebalance 频繁发生? 14. Kafka 的消息存储机制?为什么顺序写磁盘性能高? 15. Kafka 的日志分段(Log Segment)原理?日志清理策略(删除 / 压缩)? 16. Kafka 的零拷贝(Zero Copy)原理?如何提升数据传输效率? 17. Kafka 如何保证消息不丢失?(从生产、存储、消费三个环节分析) 18. Kafka 如何保证消息不重复?(生产端、消费端分别如何处理) 19. Kafka 的高可用机制?集群中某个 Broker 宕机后如何保证服务可用? 20. Kafka 的分区分配策略有哪些?(Range、RoundRobin、Sticky 等)各自的适用场景? 21. Kafka 的延时队列如何实现? 22. Kafka 的死信队列(DLQ)作用?如何配置和使用? 23. Kafka 与 RabbitMQ 的核心区别?各自的适用场景? 24. Kafka 的吞吐量为什么高?(从架构、存储、网络等角度分析) 25. Kafka 的数据积压问题如何排查和解决? 26. Kafka 的分区数设置有什么原则?分区数过多 / 过少会有什么问题? 27. Kafka 的事务消息原理?如何实现生产端和消费端的事务一致性? 28. Kafka 的 Compact 日志清理策略适用场景?如何避免数据膨胀? 29. Kafka 的监控指标有哪些核心项?(如生产 / 消费速率、分区副本同步状态、UnderReplicatedPartitions 等) 30. Kafka 的跨集群数据同步如何实现? 31. Kafka 的消费者心跳机制(Heartbeat)原理?session.timeout.ms 的作用? 32. Kafka 的消息压缩机制?支持哪些压缩算法?压缩的优缺点? 33. Kafka 的 Broker 如何选举 Controller?Controller 的核心职责? 34. Kafka 在分布式事务中如何实现最终一致性? 35. Kafka 的 Zookeeper (或 KRaft)的作用?KRaft 相比 Zookeeper 有什么优势?
支持与分享
如果这篇文章对你有帮助,欢迎分享给更多人或赞助支持!