Chapter 4. 카프카 컨슈머: 카프카에서 데이터 읽기

hubtwork commented 3 weeks ago

Chapter Ownership : @KangHun-Lee

KangHun-Lee commented 2 weeks ago

컨슈머 그룹과 파티션 리밸런스

컨슈머 그룹의 개념

컨슈머 그룹(Consumer Group)은 메시지를 병렬로 처리하기 위해 설계된 구조입니다.
같은 그룹에 속한 컨슈머들은 서로 다른 파티션을 할당받아 독립적으로 메시지를 처리합니다.
예를 들어, 3개의 파티션이 있는 토픽과 3명의 컨슈머가 있을 때, 각 컨슈머는 하나의 파티션을 할당받아 메시지를 병렬로 처리하게 됩니다.

파티션 할당 방식

Kafka는 각 파티션을 컨슈머 그룹 내의 컨슈머들에게 자동으로 할당합니다.
만약 한 컨슈머가 추가되거나 제거되면, Kafka는 리밸런스를 통해 파티션을 다시 배분합니다.
예를 들어, 4개의 파티션과 2명의 컨슈머가 있을 경우, 각 컨슈머는 2개의 파티션을 할당받아 처리하게 됩니다.

컨슈머가 파티션의 갯수보다 많을 경우 유휴 컨슈머가 생기므로 주의 필요

파티션 리밸런스

리밸런스 개념

리밸런스는 컨슈머 그룹에 새로운 컨슈머가 추가되거나 기존 컨슈머가 제거될 때 파티션 할당을 재조정하는 과정입니다.
이 과정에서 일시적으로 메시지 처리가 중단될 수 있습니다.

조급한 리밸런스

이 방식은 메시지 처리 중단이 발생할 수 있습니다.

협력적 리밸런스

협력적 리밸런스(cooperative rebalance)는 메시지 처리 중단을 최소화하기 위한 방법입니다.
이 방식에서는 컨슈머들이 서서히 리밸런스에 참여하여 전체적인 리밸런스 과정이 보다 매끄럽게 진행되도록 합니다.
예를 들어, 새로운 컨슈머가 추가되면 기존 컨슈머와의 협력을 통해 리밸런스가 이루어지며, 이 과정에서 메시지 처리가 중단되지 않도록 합니다.

정적 그룹 멤버십

정적 그룹 멤버십의 필요성

정적 그룹 멤버십(Static Membership)은 컨슈머 그룹에서 리밸런스의 부하를 줄이기 위한 방법입니다.
이를 통해 동일한 컨슈머가 여러 번 그룹에 가입할 때 발생하는 리밸런스를 방지할 수 있습니다.
이 기능을 사용하면, 동일한 컨슈머가 재연결될 때 기존의 파티션 할당을 유지할 수 있어, 리밸런스가 필요 없게 됩니다.

리밸런스 이후의 처리

리밸런스가 발생한 이후에도 각 컨슈머는 할당받은 파티션을 올바르게 처리해야 합니다.
예를 들어, 컨슈머가 종료된 후 다시 시작되면, 이전에 처리 중이던 파티션의 위치를 기억하고 다시 처리할 수 있어야 합니다.

KafkaConsumer 생성 및 토픽 구독

KafkaConsumer 인스턴스 생성

KafkaConsumer 인스턴스를 생성할 때는 부트스트랩 서버, 키, 디시리얼라이저 등의 기본 설정이 필요합니다.
이러한 설정을 통해 KafkaConsumer는 특정 Kafka 클러스터에 연결됩니다.

예시 코드

Properties props = new Properties();
props.put("bootstrap.servers", "broker1:9092,broker2:9092");
props.put("group.id", "test-group");
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);

토픽 구독

subscribe 메소드를 사용하여 특정 토픽에 대해 구독할 수 있습니다.
하나 이상의 토픽을 동시에 구독할 수 있으며, KafkaConsumer는 이 토픽들에서 메시지를 읽어들입니다.

예시 코드

consumer.subscribe(Collections.singletonList("customerCountries"));

폴링 루프

폴링 루프 소개

KafkaConsumer는 메시지를 지속적으로 가져오기 위해 폴링 루프(polling loop)를 사용합니다.
이 루프는 일정 시간 동안 메시지를 가져오고, 가져온 메시지를 처리합니다.
poll() 메소드를 사용하여 메시지를 가져오며, 이 메소드는 설정된 타임아웃 내에 새로운 데이터를 반환합니다.

데이터 처리 과정

폴링 루프에서 가져온 메시지는 처리 로직을 거치게 됩니다.
메시지는 키와 값의 형태로 받아지며, 이를 적절히 처리한 후 필요한 경우 오프셋을 커밋(commit)하여 메시지가 중복 처리되지 않도록 합니다.

예시 코드

while (true) {
    ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
    for (ConsumerRecord<String, String> record : records) {
        System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
    }
    consumer.commitAsync();
}

스레드 안정성

KafkaConsumer는 스레드 안전하지 않으므로, 여러 스레드에서 동시에 접근할 경우 예기치 않은 동작이 발생할 수 있습니다.
이를 방지하기 위해 각 스레드는 별도의 KafkaConsumer 인스턴스를 사용해야 합니다.
또한, 컨슈머의 메소드 호출은 단일 스레드에서만 이루어져야 합니다.
컨슈머 로직을 자체적인 객체로 감싼 다음 자바의 ExecutorService를 사용하여 각자의 컨슈머를 가지는 다수의 스레드에서 실행하는 방법도 있습니다.
이벤트를 받아서 큐에 넣는 컨슈머 하나와 이 큐에서 이벤트를 꺼내서 처리하는 여러 개의 워커 스레드를 사용하는 방법도 있습니다.

컨슈머 설정 옵션

중요 설정 옵션

1. `auto.offset.reset`

설명: 이 설정은 컨슈머가 처음으로 파티션을 읽거나, 기존 오프셋이 유효하지 않은 경우 데이터를 어디서부터 읽기 시작할지를 결정합니다.
중요성:
- 새롭게 추가된 컨슈머나 오프셋을 찾을 수 없는 상황에서 메시지 소비의 시작 위치를 결정하기 때문에, 데이터의 일관성과 처리 흐름에 큰 영향을 미칩니다.
- 예를 들어, "earliest"로 설정하면 컨슈머는 가능한 가장 이른 시점부터 메시지를 읽기 시작하여, 데이터 유실을 방지할 수 있습니다.

2. `enable.auto.commit`

설명: 이 설정은 컨슈머가 자동으로 오프셋을 커밋할지 여부를 결정합니다.
중요성:
- 자동 커밋을 사용하면 컨슈머가 주기적으로 오프셋을 커밋하여, 메시지가 중복 처리되는 것을 방지할 수 있습니다.
- 하지만 자동 커밋을 사용하면 메시지 처리 실패 시에도 오프셋이 커밋될 수 있어 데이터 손실의 위험이 있습니다.
- 따라서, 자동 커밋을 사용하지 않고 수동 커밋을 통해 메시지 처리 후에 오프셋을 커밋하는 것이 더 안전할 수 있습니다.

3. `fetch.min.bytes` 및 `fetch.max.wait.ms`

설명: 이 설정들은 컨슈머가 브로커로부터 데이터를 가져올 때의 최소 데이터 크기와 대기 시간을 조정합니다.
중요성:
- 이 두 설정은 네트워크 효율성과 지연 시간 간의 균형을 맞추는 데 중요합니다.
- fetch.min.bytes가 높으면 네트워크 오버헤드를 줄일 수 있지만, 데이터 도착에 시간이 걸릴 수 있습니다.
- fetch.max.wait.ms는 이 대기 시간을 제한하여 지연을 최소화합니다.

4. `max.poll.records`

설명: 이 설정은 한 번의 poll() 호출에서 가져올 수 있는 최대 레코드 수를 지정합니다.
중요성:
- 이 설정은 컨슈머의 메모리 사용량과 메시지 처리량을 직접적으로 제어합니다.
- 너무 많은 레코드를 가져오면 메모리 사용량이 급증할 수 있으며, 너무 적은 레코드를 가져오면 처리 효율이 떨어질 수 있습니다.

5. `session.timeout.ms` 및 `heartbeat.interval.ms`

설명: 이 설정들은 컨슈머 그룹에서 컨슈머가 살아있는지 확인하기 위한 타임아웃과 하트비트 전송 간격을 설정합니다.
중요성:
- 이 설정들은 컨슈머 그룹의 안정성과 리밸런싱에 큰 영향을 미칩니다.
- 타임아웃이 너무 짧으면 컨슈머가 리밸런싱에 의해 자주 제거될 수 있고, 너무 길면 컨슈머 장애 감지가 지연될 수 있습니다.

fetch.min.bytes

설명: 컨슈머가 브로커에서 데이터를 가져오기 전에 기다릴 최소 데이터 크기를 지정합니다. 설정된 크기의 데이터가 모일 때까지 요청을 대기시킵니다.
기본값: 1바이트
사용 예시: 데이터량이 적을 때 네트워크 오버헤드를 줄이기 위해 사용합니다.

fetch.max.wait.ms

설명: 컨슈머가 데이터를 가져오기 위해 fetch.min.bytes를 만족하지 못할 경우 최대 대기 시간을 설정합니다.
기본값: 500ms
사용 예시: 데이터를 더 빠르게 가져오고자 할 때 대기 시간을 조정합니다.

fetch.max.bytes

설명: 컨슈머가 한 번에 가져올 수 있는 최대 데이터 바이트 수를 지정합니다.
기본값: 50MB
사용 예시: 큰 메시지나 많은 양의 데이터를 처리할 때 유용합니다.

max.poll.records

설명: 한 번의 poll() 호출에서 가져올 수 있는 최대 레코드 수를 지정합니다.
기본값: 500
사용 예시: 처리할 레코드 수를 제한하여 메모리 사용량을 조절합니다.

max.partition.fetch.bytes

설명: 파티션당 한 번에 가져올 수 있는 최대 바이트 수를 설정합니다.
기본값: 1MB
사용 예시: 파티션에서 많은 데이터를 동시에 가져올 때 사용합니다.

session.timeout.ms 그리고 heartbeat.interval.ms

설명: 컨슈머가 브로커에 "정상 작동" 신호를 보내는 시간 간격과 세션 종료까지의 시간을 설정합니다.
기본값: session.timeout.ms는 10초, heartbeat.interval.ms는 3초
사용 예시: 컨슈머 그룹 내에서 장애 감지를 위한 설정입니다.

max.poll.interval.ms

설명: 컨슈머가 데이터를 가져오기 위한 최대 대기 시간을 설정합니다. 이 시간 내에 poll()이 호출되지 않으면 컨슈머는 죽은 것으로 간주됩니다.
기본값: 5분
사용 예시: 긴 작업을 수행하는 경우 이 값을 늘려줍니다.

default.api.timeout.ms

설명: 모든 API 호출의 기본 타임아웃을 설정합니다.
기본값: 60초
사용 예시: 네트워크 지연이 길거나 처리 시간이 긴 작업에서 타임아웃 조정에 사용합니다.

request.timeout.ms

설명: 컨슈머 요청의 타임아웃 시간을 설정합니다.
기본값: 30초
사용 예시: 네트워크 환경이 불안정할 때 타임아웃 시간을 늘리거나 줄일 수 있습니다.

auto.offset.reset

설명: 오프셋이 존재하지 않거나 유효하지 않을 경우의 동작을 정의합니다.
옵션: "earliest", "latest", "none"
사용 예시: 새로 시작한 컨슈머가 데이터를 어디서부터 읽기 시작할지를 결정합니다.

enable.auto.commit

설명: 컨슈머가 자동으로 오프셋을 커밋할지 여부를 결정합니다.
기본값: true
사용 예시: 자동 커밋을 통해 컨슈머의 오프셋 관리를 간소화합니다.

partition.assignment.strategy

설명: 파티션 할당 전략을 설정합니다.
옵션: "Range", "RoundRobin", "Sticky"

사용 예시: 컨슈머 그룹 내에서 파티션 할당 방식을 조정합니다.

Range: 토픽별로 파티션을 나누어 컨슈머에게 할당합니다. 이 방법은 특정 컨슈머가 여러 파티션을 독점하게 될 가능성이 있습니다.
RoundRobin: 모든 컨슈머에게 파티션을 순서대로 할당합니다.
Sticky: 파티션의 이동을 최소화하며, 이전 할당 상태를 최대한 유지하려고 합니다.
Cooperative Sticky: Sticky 할당 전략과 유사하지만, 컨슈머가 리밸런스에 참여하는 방식이 다릅니다.

client.id

설명: 클라이언트를 식별하는 데 사용되는 ID를 설정합니다.
사용 예시: 모니터링과 로깅에 사용됩니다.

client.rack

설명: 클라이언트가 위치한 랙 정보를 설정하여 데이터 전송 최적화를 돕습니다.
사용 예시: 특정 랙에 있는 컨슈머에게 데이터를 우선적으로 전송하도록 설정합니다.

group.instance.id

설명: 정적 멤버십을 위한 그룹 인스턴스 ID를 설정합니다.
사용 예시: 컨슈머 그룹 내에서 특정 멤버를 유지하려는 경우 사용합니다.

receive.buffer.bytes, send.buffer.bytes

설명: 네트워크 전송 시 사용되는 버퍼 크기를 설정합니다.
사용 예시: 전송 속도와 메모리 사용을 최적화하기 위해 조정합니다.

offsets.retention.minutes

설명: 오프셋 보관 기간을 분 단위로 설정합니다.
사용 예시: 컨슈머 그룹 내의 오프셋을 얼마나 오래 보관할지를 결정합니다.

오프셋과 커밋

오프셋: Kafka에서 각 메시지가 차지하는 고유한 위치를 의미합니다. 각 파티션에서 메시지는 고유한 오프셋을 가집니다.
커밋: Kafka Consumer가 특정 오프셋까지의 메시지를 성공적으로 처리했음을 Kafka에 알리는 행위입니다. 이를 통해 동일 메시지가 중복 처리되지 않도록 보장합니다.

자동 커밋

설명: enable.auto.commit을 true로 설정하면, Kafka Consumer는 일정 간격으로 자동으로 오프셋을 커밋합니다.
장점: 설정이 간단하고, 자동으로 오프셋 관리가 됩니다.
단점: 메시지 처리 실패 시에도 오프셋이 커밋될 수 있어, 데이터 유실 가능성이 있습니다.

현재 오프셋 커밋하기

설명: 자동 커밋 대신 수동으로 오프셋을 커밋할 수 있습니다. 이를 통해 메시지를 안전하게 처리한 후에만 오프셋을 커밋할 수 있습니다.

비동기적 커밋

설명: commitAsync()를 사용하여 비동기적으로 오프셋을 커밋할 수 있습니다. 이는 커밋 요청을 비동기적으로 처리하여 더 빠른 성능을 제공합니다.

동기적 커밋과 비동기적 커밋을 함께 사용하기

설명: 안전성을 높이기 위해, 정기적으로 동기적 커밋과 비동기적 커밋을 함께 사용할 수 있습니다.

특정 오프셋 커밋하기

설명: 특정 파티션의 특정 오프셋을 커밋할 수 있습니다. 이를 통해 커밋 전략을 보다 유연하게 관리할 수 있습니다.

리밸런스 리스너

설명: 리밸런스는 Kafka에서 컨슈머 그룹의 파티션 할당이 변경될 때 발생합니다. 리밸런스 리스너를 구현하면, 리밸런스가 일어나기 전과 후에 특정 작업을 수행할 수 있습니다.
사용 예시: 리밸런스가 발생하기 전에 현재 오프셋을 커밋하거나, 리밸런스가 완료된 후 새로운 파티션 할당을 처리할 수 있습니다.

특정 오프셋의 레코드 읽어오기

설명: 특정 오프셋에서부터 레코드를 읽어오는 방법입니다. 이 방법은 데이터 복구나 특정 지점부터 다시 데이터를 처리할 때 유용합니다.

예시 코드:

consumer.seek(new TopicPartition("topic", partition), offset);

폴링 루프를 벗어나는 방법

설명: 폴링 루프는 Kafka Consumer가 데이터를 지속적으로 가져오는 루프입니다. 하지만 이 루프를 안전하게 벗어나려면 특정 방법을 사용해야 합니다.
방법: ShutdownHook을 사용하여 종료 시점을 잡거나, WakeupException을 활용하여 안전하게 폴링 루프를 종료할 수 있습니다.

디시리얼라이저

설명: Kafka는 메시지를 바이트 배열로 저장하므로, 이를 적절한 객체로 변환하기 위해 디시리얼라이저를 사용합니다. 기본적으로 제공되는 StringDeserializer, IntegerDeserializer 외에, 사용자 정의 디시리얼라이저를 구현할 수 있습니다.

사용 예시:

props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

커스텀 디시리얼라이저

설명: Kafka Consumer에서 특정 요구 사항에 맞는 커스텀 디시리얼라이저를 구현하여 사용합니다.

예시 코드:

public class CustomerDeserializer implements Deserializer<Customer> {
    @Override
    public Customer deserialize(String topic, byte[] data) {
        // 데이터 변환 로직
    }
}

Avro 디시리얼라이저 사용하기

설명: Avro와 같은 포맷을 사용하여 더 복잡한 메시지 구조를 처리할 수 있습니다. 이를 위해 Avro 디시리얼라이저를 사용합니다.

예시 코드:

props.put("value.deserializer", "io.confluent.kafka.serializers.KafkaAvroDeserializer");

독립 실행 컨슈머

설명: 컨슈머 그룹 없이 독립적으로 실행되는 컨슈머입니다. 특정 파티션의 메시지를 개별적으로 처리할 때 사용됩니다.
사용 예시: subscribe 대신 assign 메소드를 사용하여 특정 파티션을 할당받아 데이터를 처리합니다.

CHOICORE commented 2 weeks ago

만약 프로듀서가 컨슈머의 처리속도 보다 더 빠른 속도로 토픽에 메시지를 쓰게 된다면 어떻게 될까?
- 새로 추가되는 메시지의 속도를 따라잡을 수 없기 때문에 점차 지연되어 실시간 성을 잃어버리게 된다.

토픽으로부터 데이터를 읽어 오는 작업을 확장 할 수 있어야한다.

여러개의 컨슈머가 하나의 토픽을 읽어 분할 처리를 할 수 있도록 하는 것이 필요하다. 그렇다면 컨슈머를 늘리면 해결이 될까?

1개 이상의 토픽에 대해 모든 메시지를 받아야하는 애플리케이션 별로 새로운 컨슈머 그룹을 생성한다. 토픽에서 메시지를 읽거나 처리하는 규모를 확장하기 위해서는 이미 존재하는 컨슈머 그룹에 새로운 컨슈머를 추가함으로써 해당 그룹 내의 컨슈머 각각이 메시지의 일부만 받아서 처리하도록 한다. 컨슈머의 개수는 파티션의 개수보다 많게 설정하게 되면 메시지를 받을 수 없게 된다.

리밸런스 (또밸런싱)

컨슈머 그룹 내의 컨슈머가 추가되거나 제거되면 리밸런싱이 발생한다.
리밸런싱이 발생하면 컨슈머 그룹 내의 컨슈머들이 새로운 파티션을 할당받거나 기존에 할당받았던 파티션을 해제한다.

하나의 스레드당 하나의 컨슈머

카프카의 컨슈머는 thread-safe 하지 않다. (스프링 카프카에 괜히 팩토리가 있는게 아니다.)

소감

고가용성을 위해 컨슈머 그룹, 파티셔닝, 리밸런싱, 오프셋 커밋 등 다양한 요소들에 대해서 알게되서 좋았다. 뭐 카프카의 생태계를 알게 되는 점은 흥미롭고 재밌다. 그러나, 결국 설정 싸움인건가? 매직넘버를 내가 어떻게 찾냐... 라는 생각이 스쳐 지나갔다. 뭐 카프카 구축은 인프라 형님들께 맡기고, 스프링 카프카는 그냥 쓰면 되겠지? (스프링 카프카도 설정 싸움이 있을텐데) 그래서 스프링 카프카를 사용할 때 주의해야할 설정들이 궁금하다.

zinokim commented 2 weeks ago

소감

p.92 카프카 클러스터에 파티션이 매우 많다면(3만 개 이상이라든지) ... 생략

3만 개 이상의 파티션이 필요한 경우는 어떤 경우인지 전혀 짐작이 가지 않는다.

현재 회사에서는 JsonDeserializer를 사용하고 있고 특별히 Serializer와 Deserializer에 대해서 고민하지 않았던 것 같다. StringDeserializer, AvroDeserializer, JsonDeserializer 무엇을 쓰든 잘 알고 써야겠다.

오프셋 커밋이 상당히 중요한 개념이라고 읽혔고, 그만큼 전략적으로 신경을 많이 쓴 것 같았다. 오프셋 커밋 전략을 보통의 회사에서는 어떤 식으로 가져가는지 궁금하다. 지금 회사에서 사용하고 있는 카프카 설정이 많지 않지만 어떤 설정인지 잘 모르고 있었는데 다시 한 번 살펴볼 계획이다.

프로듀서든 컨슈머든 개념 용어에 대한 내용들은 이해하겠는데 구체적인 설정값들과 상황에 대해서 이해가 바로바로 되지는 않는다. (카프카 경험이 없어서인가 이해력이 부족한 것인가...)

위에 언급한 3만 개 이상의 파티션도 그렇고 카프카가 많은 설정을 통해 사용할 수 있도록 했는데, 저 많은 설정들을 직접 구성하고 사용하는 경우는 어떤 경우가 있을지 궁금하다.

hubtwork commented 2 weeks ago

소감

컨슈머의 리밸런싱 및 관련한 설정은 실제로 카프카를 어떻게 활용하고자 하는 것에 엄청난 영향을 미친다. 예를 들어, 단순히 EDA 를 위해 카프카를 활용하는 것은 어렵지 않을 수 있다. 특정 토픽에 대해서 메세지 발행량과 토픽의 파티션 별 lag 에 대해서 고려하고, 이를 잘 소비할 수 있도록 파티션 개수 및 리밸런싱이 덜 일어나기 위한 작업 속도 등을 고려해 적절한 설정값만 정해주면 된다. ( 이건 스프링 쓰고 있으면 spring-data-kafka 가 아주 손쉽게 Configuration 으로 지정할 수 있도록 제공하기 때문에 너무나도 쉽다. ) 그런데 이런 상황이 생길 수 있다. 예를 들어, 동일한 데이터에 대한 이벤트의 후속처리가 순차적으로 이루어져야하기 때문에 특정 데이터를 메세지의 키로 지정해 각 파티션 내에서 순차보장을 하는 Skill 을 우리가 사용하게 되는데, 여기서 파티션 갯수나 메세지 발행량 등에 의해 컨슈머 성능이 일부 파티션에 대해서 떨어져 엄청난 lag 이 발생하게 되는 현상을 볼 수도 있다.

e.g. 아래는 일부 파티션의 경우 lag 이 없으나 특정 파티션에서 메세지가 burst 되어 파티션 lag 이 기하급수적으로 쌓인 케이스. 실제로 현재 파티션별 offset Gap 이 적으면 3만개~ 많으면 6만개 정도 차이난다.

이런 경우엔, 파티션의 개수를 늘리거나 처리량을 늘리는 등 다양한 고민을 하게 되는데 이 경우 파티션의 개수를 늘리면 줄일 수 없다는 카프카의 절대법칙 때문에 함부로 늘릴수도 없어서 실력이 여기서 드러난다. 파티션을 늘린다고 해서 Lag 이 줄어들까? ( 파티션 hash 가 늘어나 전체적인 lag 은 줄어들 수 있지만 특정 lag 을 유발하는 주범이 또 같은 파티션에 몰려 결국 다시 lag 이 생길 수도 있다. )

실제로 10년차 넘는 개발자 분이 "그냥 파티션 늘리면 안되요?" 하는 걸 이전 직장에서 들었는데 얼처구니가..

또한 유량제어를 위해 카프카를 중도에 두어 단계적으로 발행을 압축하는 방식을 활용한다던지, 하기 위해 아래 설정 값들에 대해 이해하고 적절하게 조절하는 것이 애플리케이션 개발자의 실력을 드러내게 된다.

e.g. 아래는 특정 시스템적 설계를 해소하기 위해 제어한 Consumer Property

이에 이런 부분들을 고려해서 잘 공부하고 활용하였으면 좋겠다.

iamzin commented 2 weeks ago

AWS 만큼 설정의 숙련도가 필요해 보이지만, 서버를 EC2로 수동 배포 해보듯이 컨슈머 그룹 없이 단순하게도 구현해볼 수 있을 것 같다. SQS로 구성한 로직이 있다면 가장 단순한 형태의 프로듀서와 컨슈머를 구성해보고 싶다.

또한 결국 사용하게 될 Spring Kafka에 대해서도 접목해서 이해해보는 연습을 해야겠다.

컨슈머 그룹의 기능이 필요한게 아니며 리밸런싱이 필요하지 않다면 굳이 컨슈머 그룹을 사용하지 않아도 된다.

책에서 언급한 해당 경우는 아래와 같다.

하나의 컨슈머가 토픽의 모든 파티션으로부터 모든 데이터를 읽어와야 하는 경우
토픽의 특정 파티션으로부터 데이터를 읽어와야 하는 경우

또한 컨슈머 그룹이 없어도 필요한 경우 오프셋을 커밋할 수 있다. 이 경우 컨슈머가 어떤 파티션을 읽어야 하는지 명확히 알 경우 subscribe 할 필요 없이 파티션을 스스로 할당 받을 수 있다.

추가) 컨슈머 그룹이 없이 독립 실행 컨슈머를 사용하면 SQS랑 다를게 없다는 걸로 이해되는데, 이 부분은 좀 더 찾아보고 보강하겠습니다.

(아직 예제로 코드 구현은 진행 중이라, 완성되면 추가 첨부해보겠습니당)

kimsunhak commented 2 weeks ago

소감

설정에 대한 내용들이 조금 인상 깊었다. 과거 실무에서 offset을 읽을때 earliest, latest 두 옵션을 사용했다가, 수동 커밋으로 작업했었다.

옵션 설정에서 아래에 해당하는 설정은 좀 더 중요하게 잡았으면 좋겠다고 생각하고, fetch.max.bytes = 한번에 가져 올 수 있는 최소 크기 fetch.max.wait.ms = 설정 값보다 적은 경우 요청에 대한 응답을 기다리는 최대 시간 max.partition.fetch.bytes = 파티션당 가져올 수 잇는 최대 크기 max.poll.records poll = 최대 Record 수

Consumer는 얼마 만큼의 Record의 양을 가져와야 하는지와 만일 Consumer가 한번에 읽어들이는 양이 적다면 Fetch(Messages Read)가 반복적으로 일어나게 되면서 성능 저하가 발생하는 이슈가 있으니 다들 이 부분 참고하시길..

KangHun-Lee commented 2 weeks ago

카프카 프로듀서 성능 테스트

./kafka-producer-perf-test.sh --topic 토픽명 --throughput -1 --num-records 1000000 --record-size 600 --producer-props bootstrap.servers=첫번째:9092,2번째:9092,3번째:9092

hlab-books / kafka-the-definitive-guide