배치의 JOB중 일부가 중지되는 멈춤현상이 발생됩니다. 동일 사례가 있는지.. 의견문의합니다 .
- 작성자 :
- 주*남
- 작성일 :
- 2021-03-15 12:14:51
- 조회수 :
- 4,459
- 구분 :
- 운영환경 /
- 진행상태 :
- 완료
Q
안녕하세요.
전자정부 프레임워크를 기반으로 프로젝트를 수행하고 있습니다.
프레임워크 중 배치프레임워크를 공공기관에서 사용 중이고.. 한 2년 정도 되었습니다.
헌데 지난 사업에서 배치의 건수가 약 140여개 정도로 확장되면서
특이 케이스들이 발생되어 문의 드릴려고 하는데요
JOB의 개수가 많아지면서 발생되는 현상으로 보이는데
일부 JOB이.. 기동 중에 멈춰버리는 현상이 발생되고 있습니다.
간격은 약 2~3일 간격으로 발생되고 있습니다.
멈춤현상의 확인 방법은 batch_step_execution 테이블에서
멈춘것으로 확인되는 JOB의 상태가
commit_count=3
read_count = 15000
status = 'STARTED'
exit_code='EXECUTING'
예시로 든 상태인데요
저 상태를 마지막으로 하루 이상.. 길게는 일주일까지 동작하지 못하고 남아 있는 상태입니다.
이 현상이 2~3일에 한번씩 발생되고 있는데요
보시면 5000건씩 commit_interval이 설정되어있기 때문에..
전체 데이터가 20050건이라고 하면 약 3번정도 처리가 되고 그 다음 4번째, 5번째 처리를 해야 하는 시점에..
멈춰버리는 현상이 발생됩니다.
배치프로그램 전체가 중지되는 것은 아니고, 멈춤이 발생된 저 1개 JOB만 더이상 기동이 되지 않는 현상입니다.
현재는 DB에서 뭔가 응답을 못주고 있는게 아닌지 싶어서 원인을 찾고 있는 중입니다만..
JOB 30개를 동시에 기동하는 배치프로그램을 만들어서 기동해봤더니.. 동일하게.. 배치가 멈춘듯한 현상을 보여서
commit_count=0
read_count = 0
status = 'STARTED'
exit_code='EXECUTING'
상태로 남아 있습니다.
그래서 배치프로그램의 설정으로 인해서 멈춤현상이 발생될 수 있는지 확인하고 싶어서 문의글을 작성합니다.
이 질의는.. "배치프로그램에 문제가 있습니다." 라는 내용이 아니라
비슷한 현상을 경험하신 분이 계신지.. 사례가 있다면 어떻게 조치하셨었는지 여쭤보고 싶어서 작성한 글입니다.
전자정부 프레임워크를 기반으로 프로젝트를 수행하고 있습니다.
프레임워크 중 배치프레임워크를 공공기관에서 사용 중이고.. 한 2년 정도 되었습니다.
헌데 지난 사업에서 배치의 건수가 약 140여개 정도로 확장되면서
특이 케이스들이 발생되어 문의 드릴려고 하는데요
JOB의 개수가 많아지면서 발생되는 현상으로 보이는데
일부 JOB이.. 기동 중에 멈춰버리는 현상이 발생되고 있습니다.
간격은 약 2~3일 간격으로 발생되고 있습니다.
멈춤현상의 확인 방법은 batch_step_execution 테이블에서
멈춘것으로 확인되는 JOB의 상태가
commit_count=3
read_count = 15000
status = 'STARTED'
exit_code='EXECUTING'
예시로 든 상태인데요
저 상태를 마지막으로 하루 이상.. 길게는 일주일까지 동작하지 못하고 남아 있는 상태입니다.
이 현상이 2~3일에 한번씩 발생되고 있는데요
보시면 5000건씩 commit_interval이 설정되어있기 때문에..
전체 데이터가 20050건이라고 하면 약 3번정도 처리가 되고 그 다음 4번째, 5번째 처리를 해야 하는 시점에..
멈춰버리는 현상이 발생됩니다.
배치프로그램 전체가 중지되는 것은 아니고, 멈춤이 발생된 저 1개 JOB만 더이상 기동이 되지 않는 현상입니다.
현재는 DB에서 뭔가 응답을 못주고 있는게 아닌지 싶어서 원인을 찾고 있는 중입니다만..
JOB 30개를 동시에 기동하는 배치프로그램을 만들어서 기동해봤더니.. 동일하게.. 배치가 멈춘듯한 현상을 보여서
commit_count=0
read_count = 0
status = 'STARTED'
exit_code='EXECUTING'
상태로 남아 있습니다.
그래서 배치프로그램의 설정으로 인해서 멈춤현상이 발생될 수 있는지 확인하고 싶어서 문의글을 작성합니다.
이 질의는.. "배치프로그램에 문제가 있습니다." 라는 내용이 아니라
비슷한 현상을 경험하신 분이 계신지.. 사례가 있다면 어떻게 조치하셨었는지 여쭤보고 싶어서 작성한 글입니다.
환경정보
-
- OS 정보 : 리눅스
- 표준프레임워크 버전 : 3.7
- JDK(JRE) 정보 : 1.8
- WAS 정보 : 배치프레임워크(jar파일 runabled 환경임)
- DB 정보 : postgresql(agensdb)
- 기타 환경 정보 : agensdb는 국내업체가 postgresql을 기반으로 개발한 그래프DB입니다.
A
안녕하세요.
표준프레임워크센터 입니다.
해당 증상과 관련하여
센터에서 이슈로 보고된적은 현재까지 없습니다.
초기에는 이런 현상이 없다가
배치잡의 개수가 늘어나면서 이런증상이 보였다고 하시는걸 봐서
기본환경에 문제가 아닐까 추측이 됩니다.
일반적으로 JDK는 VM을 기반으로 하고 있는데
VM이 GC등을 자동으로 처리해 주지만
할당된 메모리가 부족한 경우
프로세스가 VM에 의해 정리되거나 오류가 발생될듯 합니다.
또는 디스크용량등 제한이 있는 리소스를 우선 점검해 보시거나
구동시간에 제한이 있는것인지도 확인해 보셔야 할듯 합니다.
해당 부분을 우선 점검해 보셔야 할듯 합니다.
감사합니다.
표준프레임워크센터 입니다.
해당 증상과 관련하여
센터에서 이슈로 보고된적은 현재까지 없습니다.
초기에는 이런 현상이 없다가
배치잡의 개수가 늘어나면서 이런증상이 보였다고 하시는걸 봐서
기본환경에 문제가 아닐까 추측이 됩니다.
일반적으로 JDK는 VM을 기반으로 하고 있는데
VM이 GC등을 자동으로 처리해 주지만
할당된 메모리가 부족한 경우
프로세스가 VM에 의해 정리되거나 오류가 발생될듯 합니다.
또는 디스크용량등 제한이 있는 리소스를 우선 점검해 보시거나
구동시간에 제한이 있는것인지도 확인해 보셔야 할듯 합니다.
해당 부분을 우선 점검해 보셔야 할듯 합니다.
감사합니다.