본문 바로가기

반응형

kafka

[Apache Kafka] 컨슈머 랙(consumer lag)이란? 아파치 카프카에서 컨슈머 랙(consumer lag)은 시스템 성능과 데이터 처리 효율을 평가하는 데 중요한 지표 중 하나입니다. 이 지표를 통해 카프카 클러스터의 상태를 모니터링하고, 프로듀서와 컨슈머 간의 데이터 처리 속도 차이를 파악할 수 있습니다.컨슈머 랙의 정의와 중요성컨슈머 랙은 카프카 프로듀서가 토픽의 파티션에 데이터를 저장할 때 부여되는 오프셋(고유 식별자)과, 컨슈머가 해당 데이터를 읽어가는 오프셋 사이의 차이를 말합니다. 프로듀서가 데이터를 파티션에 저장하는 속도가 컨슈머가 데이터를 소비하는 속도보다 빠를 경우, 이 차이는 점점 커지게 됩니다. 컨슈머 랙의 크기는 처리 대기 중인 데이터의 양을 나타내며, 이는 시스템의 지연 시간과 직접적인 관련이 있습니다.컨슈머 랙의 계산 방법각 파티션.. 더보기
[Apache Kafka] 카프카 토픽이란? 아파치 카프카는 실시간 데이터 스트리밍 처리의 강력한 도구입니다. 이 도구에서 중심적인 역할을 하는 것이 바로 '토픽(topic)'이라고 생각 합니다. 토픽은 카프카의 기본적인 데이터 저장소 단위로, 데이터베이스의 테이블이나 파일 시스템의 폴더와 유사한 역할을 합니다.토픽의 구성과 특징다중 파티션 구조: 하나의 토픽은 여러 개의 파티션으로 나뉠 수 있습니다. 각 파티션은 데이터를 차례대로 쌓는 큐와 유사하며, 이 구조는 데이터 처리의 병렬성을 높이고 고가용성을 보장합니다.라운드 로빈 배치: 데이터가 토픽의 파티션에 저장될 때, 특정 키가 지정되지 않은 경우, 기본적으로 라운드 로빈 방식으로 데이터가 분산 저장됩니다. 이는 각 파티션에 데이터 부하를 균등하게 분배하여 처리 속도와 효율성을 높입니다.키 기반.. 더보기

반응형