배치관련 질문있습니다
- 작성자 :
- 손*민
- 작성일 :
- 2013-07-25 20:26:49
- 조회수 :
- 953
- 구분 :
- 기타
- 진행상태 :
- 완료
Q
Egov배치를 이용하여 개발중입니다.
문제가 하나 있어 ..궁금해서 여쭤봅니다.
배치클래스중에 EgovFixedLengthTokenizer 를 사용하여
문서파일의 Length 로 컬럼을 나누는것이 있습니다.
하지만 그 문서파일안에 한글이 포함된경우 길이를 제대로 인식하지못하여
현재 오류가 발생하고 있습니다.
혹시 이러한 경우에는 어떻게 해결해야하는지...방법좀 알려주세요..
참고로 문서파일은 KSC5601 로 인코딩된 한글이 포함된 파일입니다.
문제가 하나 있어 ..궁금해서 여쭤봅니다.
배치클래스중에 EgovFixedLengthTokenizer 를 사용하여
문서파일의 Length 로 컬럼을 나누는것이 있습니다.
하지만 그 문서파일안에 한글이 포함된경우 길이를 제대로 인식하지못하여
현재 오류가 발생하고 있습니다.
혹시 이러한 경우에는 어떻게 해결해야하는지...방법좀 알려주세요..
참고로 문서파일은 KSC5601 로 인코딩된 한글이 포함된 파일입니다.
A
안녕하세요 프레임워크 센터입니다.
전자정부 배치프레임워크에서는 FixedLengthTokenizer, EgovFixedLengthTokenizer 두 가지 타입이 토크나이저를 제공하고 있습니다.
단순히 string을 고려하신다면 첫번째, byte까지 고려하신다면 두번째 클래스를 사용하시면 됩니다.
지금 같은 경우에는 자바의 인코딩 타입과 KSC5601타입이 달라서 변환하는 도중에 한글이 깨지는 경우가 발생할 수 있습니다. 토크나이저로 자르기전 변환된 한글이 제대로 되어 있는지 확인해 보시기 바랍니다.
수고하세요.
전자정부 배치프레임워크에서는 FixedLengthTokenizer, EgovFixedLengthTokenizer 두 가지 타입이 토크나이저를 제공하고 있습니다.
단순히 string을 고려하신다면 첫번째, byte까지 고려하신다면 두번째 클래스를 사용하시면 됩니다.
지금 같은 경우에는 자바의 인코딩 타입과 KSC5601타입이 달라서 변환하는 도중에 한글이 깨지는 경우가 발생할 수 있습니다. 토크나이저로 자르기전 변환된 한글이 제대로 되어 있는지 확인해 보시기 바랍니다.
수고하세요.