1. 简介
kafka (官网地址:http://kafka.)是一款分布式消息发布和订阅的系统,具有高性能和高吞吐率。 ![]() i. 消息的发布(publish)称作producer,消息的订阅(subscribe)称作consumer,中间的存储阵列称作broker。 ii. 多个broker协同合作,producer、consumer和broker三者之间通过zookeeper来协调请求和转发。 iii. producer产生和推送(push)数据到broker,consumer从broker拉取(pull)数据并进行处理。 iv. broker端不维护数据的消费状态,提升了性能。 v. 直接使用磁盘进行存储,线性读写,速度快:避免了数据在JVM内存和系统内存之间的复制,减少耗性能的创建对象和垃圾回收。 vi. Kafka使用scala编写,可以运行在JVM上。 2. 安装: a. 首先安装JRE/JDK Linux安装JDK b. 下载kafka 进入下载页面:http://kafka./downloads.html 选择Binary downloads下载 (Source download需要编译才能使用) 也可以直接在linux终端下载: Shell代码
c. 解压 Shell代码
目录: ![]() /bin 启动和停止命令等。 /config 配置文件 /libs 类库 d. 修改配置 Kafka默认开启JVM压缩指针,但只是在64位的HotSpot VM受支持,如果安装了32位的HotSpot VM,需要修改/bin/kafka-run-class.sh文件 Shell代码
找到如下行: Sh代码
去除-XX:+UseCompressedOops参数 3. 启动和停止 启动Zookeeper server: Shell代码
&是为了能退出命令行 启动Kafka server: Shell代码
停止Kafka server Shell代码
停止Zookeeper server: Shell代码
4. 单机连通性测试 运行producer: Shell代码
早版本的Kafka,--broker-list localhost:9092需改为--zookeeper localhost:2181 运行consumer: Shell代码
在producer端输入字符串并回车,查看consumer端是否显示。 5. 分布式连通性测试 Zookeeper Server, Kafka Server, Producer都放在服务器server1上,ip地址为192.168.1.10 Consumer放在服务器server2上,ip地址为192.168.1.12。 分别运行server1的producer和server2的consumer, Shell代码
Shell代码
在producer的console端输入字符串,consumer报Connection refused错误: ![]() broker, producer和consumer都注册到zookeeper上,producer和consumer的参数明确指定。问题出在broker的配置文件server.properties上: Properties代码
host名称没有指定,就是127.0.0.1,consumer去broker拿数据就有问题。设置为192.168.1.10,重启服务就好了。 |
|