CRONJOB Archives - Jaeuk's Space

EKS CronJob Pending 현상: “Preemption is not helpful for scheduling” 원인 분석

작성일자 2025년 04월 09일 글쓴이 jaeuk

문제 현상 EKS 환경에서 특정 CronJob 실행 시 다음과 같은 메시지와 함께 Pod가 Pending 상태에 머무르며 일정 시간 이후에야 실행되는 현상이 발생했습니다: 원인 분석 이 메시지는 Kubernetes 스케줄러가 다음과 같은 조건 중 하나 이상으로 인해 Pod를 즉시 스케줄하지 못했음을 의미합니다: 1. 리소스 부족 2. 스케줄 조건 미충족 (Affinity, Toleration 등) 더 읽기

Kubernetes CronJob 실패 원인 분석 및 해결: [BackoffLimitExceeded] 에러 대응법

작성일자 2025년 04월 03일2025년 04월 03일 글쓴이 jaeuk

Kubernetes CronJob 실행 실패: [BackoffLimitExceeded] 원인과 해결 💡 문제 현상 Rancher UI 또는 kubectl describe job 명령어를 통해 아래와 같은 메시지가 확인됨: [BackoffLimitExceeded] Job has reached the specified backoff limit 🔍 원인 분석 🧪 디버깅 접근 kubectl run debug-batch –rm -it –image=123456789012.dkr.ecr.region.amazonaws.com/sample-image:tag — bash ✅ 해결 방법 1. Pod 삭제 더 읽기

Spring Batch 작업을 Kubernetes CronJob으로 병렬 처리할 때의 고려사항과 커넥션 오류 대응 전략

작성일자 2025년 04월 03일2025년 04월 03일 글쓴이 jaeuk

✅ 1. Spring Batch를 Kubernetes CronJob에서 병렬로 실행하려는 시나리오 ✅ 2. HikariCP 경고: “Apparent connection leak detected” ✅ 3. MyBatis 쿼리가 길어질 때 INSERT 타임아웃 처리 @Options(timeout = 5)void insertMyData(@Param(“list”) List<MyDto> list); ✅ 4. 커넥션 오류 예외 예시 (Unknown thread id) ✅ 5. 기존 Step을 Partitioning Step으로 전환할 수 있는가?

EKS Kubernetes CronJob의 노드 분산 원리: 스케줄러 점수 기반 배치 완전 이해하기

작성일자 2025년 04월 03일2025년 04월 03일 글쓴이 jaeuk

✅ 본문 요약 (개요 흐름) 💡 핵심 질문 EKS CronJob은 LB가 없이 어떻게 노드에 분산되는가?스케줄러는 어떤 기준으로 점수를 계산해 Pod을 배치하는가? ✅ Kubernetes 스케줄러의 2단계 배치 알고리즘 ✅ 점수 산정에 사용되는 주요 요소들 기준 설명 preferred nodeAffinity 특정 라벨 가진 노드를 선호 → 점수 +10~+100 podAntiAffinity 동일한 app의 Pod이 있으면 더 읽기

Kubernetes CronJob에서 soft affinity와 podAntiAffinity의 실제 작동 방식과 노드 분산 전략 이해하기

작성일자 2025년 03월 28일2025년 03월 28일 글쓴이 jaeuk

✅ 실전 운영 중 발생 가능한 핵심 질문들 ✅ 핵심 개념 요약 개념 요약 preferredDuringSchedulingIgnoredDuringExecution soft 조건이므로 만족하지 않으면 무시하고 실행 podAntiAffinity 기준 라벨 Pod 템플릿 내 template.metadata.labels 기준 Completed, Terminating 상태 anti-affinity 대상에 포함됨 (Pod 리소스 살아 있으면 영향 줌) TTLSecondsAfterFinished Pod을 자동 GC 처리해 anti-affinity 영향 최소화 동일 더 읽기

EKS CronJob에서 BackoffLimitExceeded 오류가 발생하는 원인과 해결 방법

작성일자 2025년 03월 27일2025년 03월 27일 글쓴이 jaeuk

EKS에서 CronJob 실행 시 다음과 같은 오류 메시지를 본 적 있으신가요? [BackoffLimitExceeded] Job has reached the specified backoff limit 이 오류는 Kubernetes Batch Job이 실패했고, 설정된 최대 재시도 횟수를 초과했을 때 발생합니다. 이 글에서는 해당 에러가 발생하는 이유와, 실전에서 이를 어떻게 해결할 수 있는지 자세히 살펴봅니다. 🔍 오류 원인: backoffLimit 더 읽기

Kubernetes에서 CronJob 병렬 실행 없이 노드 그룹(batch-alpha 등) 내 분산 처리하기: rotate-group 기반 전략

작성일자 2025년 03월 27일2025년 03월 27일 글쓴이 jaeuk

📌 문제 개요 대규모 Kubernetes 클러스터에서 수백 개의 CronJob이 실행되며, 각 Job은 반드시 특정 태그(group=batch-alpha, group=batch-beta, group=batch-gamma)를 갖는 노드 풀에서만 실행되어야 합니다. 가장 중요한 요구사항은 동시에 병렬 실행이 절대로 발생해서는 안 된다는 점입니다. 📌 일반적인 접근 방식의 한계 📌 최종 채택한 전략 요약 📌 실제 구성 요소 1. CronJob YAML 더 읽기

Spring Batch Kubernetes 종료 처리: graceful shutdown, shutdown hook, 컨테이너 runtime hang 완전 정복

작성일자 2025년 03월 27일2025년 03월 27일 글쓴이 jaeuk

Kubernetes 환경에서 sample-batch 시스템은 Java 기반의 Spring Batch Job을 실행하고 있으며, 안정적인 종료 처리가 매우 중요합니다. 특히 다음과 같은 요구사항을 만족해야 합니다: 이를 위해 다음 설정 및 코드 전략을 활용했습니다: ✅ 핵심 설정 yaml복사편집activeDeadlineSeconds: 180 terminationGracePeriodSeconds: 10 ✅ 코드 전략 요약 1. Shutdown Hook에서 Whatap 처리 및 Thread 정리 Runtime.getRuntime().addShutdownHook(new 더 읽기

Kubernetes CronJob 강제 종료 및 graceful shutdown 처리 방법 (Spring Batch + 모니터링 연동)

작성일자 2025년 03월 25일2025년 03월 25일 글쓴이 jaeuk

Kubernetes CronJob을 활용해 Java 기반 Spring Batch 작업을 수행하는 환경에서, 작업 시간이 초과되었을 때의 강제 종료 처리가 필요할 수 있습니다. 이를 위해 activeDeadlineSeconds를 활용하면 설정된 시간 초과 시 작업을 종료할 수 있습니다. 그러나 기본적으로 Kubernetes는 종료 시 SIGTERM을 먼저 보내고, 이후 terminationGracePeriodSeconds 동안 graceful shutdown을 기다립니다. 이 시간이 지나야 SIGKILL을 더 읽기

Kubernetes 환경에서 Spring Boot 배치 오류 전파 및 종료 코드 처리

작성일자 2025년 03월 19일2025년 03월 19일 글쓴이 jaeuk

1. 문제 상황 Spring Boot 기반 배치 애플리케이션을 실행하는 과정에서 오류 발생 시 CallRunner까지 예외 전파 및 종료 코드 처리가 제대로 이루어지지 않는 문제가 발생했다. 2. 원인 분석 3. 해결 방법 ✅ 1️⃣ 예외가 CallRunner까지 정상적으로 전파되도록 설정 ✅ 2️⃣ System.exit() 실행 위치 조정 ✅ 3️⃣ Kubernetes Pod 종료 상태 더 읽기