博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
kafka生产,保存,消费消息过程要点个人总结
阅读量:3939 次
发布时间:2019-05-23

本文共 886 字,大约阅读时间需要 2 分钟。

一、生产

1)producer 先从 zookeeper 的 "/brokers/.../state" 节点找到该partition 的 leader

2)producer 将消息发送给该 leader

3)leader 将消息写入本地 log

4)followers 从 leader pull 消息,写入本地 log 后向 leader 发送 ACK

5)leader 收到所有 ISR 中的 replication 的ACK后,增加 HW(high watermark,最后commit 的offset)并向 producer 发送 ACK

二、保存

1)物理上把 topic 分成一个或多个 patition,计算得到相应的partition,保存到相应partition

2)保留数据是 Kafka 的一个基本特性, 但是 Kafka 不会一直保留数据,也不会等到所有消费者都读取了消息之后才删除消息。

相反,Kafka 管理员为每个主题配置了数据保留期限, 规定数据被删除之前可以保留多长时间, 或者清理数据之前可以保留的数据量大小。(时间&&大小)

3)注意:zookeeper保存的数据信息

三、消费

高级api和低级api

低级api需要指定partition以及offset(指定leader的partition)

对于每一个分区而言,只能被同一个消费者组中的其中一个消费者消费

注意:不管是生产者还是消费者,都要连接上leader的partition

 

 

总流程:首先每个broker有多个topic,每个topic有多个partition,partition有leader和follower之分,此外,partition还有offset。消费者和生产者都只能连接leader上的partition,数据是保存在kafka集群上的硬盘(顺序写的磁盘比随机写内存效率高),消费者可以属于同一个消费者组,同一个消费者组不能重复消费同一个partition。此外消费者可以指定partition和offset进行消费。补充kafka集群zookeeper的作用

转载地址:http://ejuwi.baihongyu.com/

你可能感兴趣的文章
Python函数操作集锦之字符串测试、判断函数
查看>>
Python字符串操作集锦之字符串映射表
查看>>
Python字符串操作集锦之字符串编码解码函数
查看>>
Python字符串类型转换函数
查看>>
Python有用的命令
查看>>
Python条件语句
查看>>
Python eval()函数
查看>>
Linux vi编辑器命令详解
查看>>
Linux常用命令之man/mv/shutdown/history
查看>>
Linux rz和sz命令详解
查看>>
Python 函数之函数定义、调用、传参
查看>>
Python 函数之参数、局部变量
查看>>
Python模块
查看>>
Python 包
查看>>
Python 异常处理
查看>>
Python 集合set
查看>>
Linux 系统状况之查看用户
查看>>
Linux用户和用户组管理
查看>>
Linux 磁盘管理
查看>>
Linux 内存及cpu解析
查看>>