데 이 터 를 XML 형식 으로 변환 하 는 장점

쉼표 나 탭 문자 로 구분 되 는 파일 부터 더 부하 되 는 형식 까지 다양한 형식 으로 데 이 터 를 저장 하거나 전송 해 야 하 는 경우 가 많 습 니 다.모든 형식 에 대응 하 는 해상도 기(parser)가 필요 합 니 다.이 단점 은 개발 진 도 를 늦 추고 오류 가 발생 할 수 있다.하나의 해결 방안 은 자주 사용 하 는 형식의 데 이 터 를 XML 문서 로 바 꾼 다음 에 그것 을 저장 하거나 처리 하거나 다른 형식 으로 바 꾸 는 것 이다.하나의 인 스 턴 스 는 현재 소프트웨어 내부 나 소프트웨어 간 에 데이터 저장,내 보 내기,가 져 오기,전송 기능 을 실현 하 는 데이터 형식 이 여러 가지 있 습 니 다.가장 흔히 볼 수 있 는 것 은 쉼표 나 탭 문자 의 데이터 형식,그리고 고정 데이터 형식 등 정계 형식(delimited format)이다.주소록 프로그램 이 있다 고 가정 하면 이 프로그램 은 데 이 터 를 쉼표 로 구분 하고 길이 가 고정 되 어 있 는 두 가지 형식 으로 내 보 내 는 기능 을 제공 합 니 다.쉼표 구분 형식 에서 같은 데이터 기록 의 다른 필드 를 쉼표 로 구분 합 니 다.목록 A 와 같 습 니 다.고정 길이 데이터 형식 에 기 록 된 모든 필드 는 표준 길이 가 있어 야 한다.목록 B 는 고정 길이 형식의 주소록 을 보 여 주 었 다.XML 문 서 를 만 듭 니 다.입력 데 이 터 를 분석 하고 XML 문서 로 변환 합 니 다.XML 문서(즉 org.w3c.dom.document)는 모든 문서 대상 모델(DOM)의 원본 데이터 형식 이 며 문서 데이터 에 대한 접근 을 제공 합 니 다.코드 목록 C 와 같은 buildDocument(InputStream is)를 실행 하 는 방법 으로 데이터 에 대응 하 는 문 서 를 만 들 수 있 습 니 다.이 방법 은 입력 데이터 흐름 을 한 줄 씩 읽 고 정격 에 따라 한 줄 씩 분석 합 니 다.분계 형식 데 이 터 를 분석 하려 면 PlainTextToXmlFormatter(String[]colName,String delim)와 같은 인 스 턴 스 를 만들어 야 합 니 다.분계 부 호 는 모든 문자열 일 수 있 습 니 다.고정된 길이 형식의 경우 두 번 째 구조 함수 인 PlainTextToXmlFormatter(String[]colName,int[]colLen)를 사용 해 야 합 니 다.필드 길이 배열 의 매개 변 수 를 사용 해 야 합 니 다.우리 가 준 주소록 의 예 에서 각 필드 의 길 이 는 각각 10,10,30 과 10 글자 이다.인자 colName 은 대상 데이터 기록 의 이름 을 저장 한 배열 입 니 다.이 예 에서 이름 은 각각 이름(firstName),성(lastName),email,전화번호(phone)입 니 다.데이터 줄 을 데이터 기호 로 변환 하 는 실제 분석 과정 은 getStringArray(String read,String delim)나 parseFixed LengthMessage(String read,int[]colLen)방법 을 실행 하 는 과정 입 니 다.그 반환 값 은 String 형 배열 입 니 다.이 배열 은 상기 두 가지 방법 으로 주어진 입력 을 분해 해서 얻 은 것 입 니 다.데이터 형식 이 틀 리 면 예 외 를 던 지고 오 류 를 처리 하지 않 습 니 다.setSkipError(true)방법 을 호출 하면 예 외 를 무시 하고 데이터 분석 과정 을 완성 할 수 있 습 니 다.이 방법 을 사용 하면 예 외 를 던 지 는 것 을 방지 할 수 있 지만,프로그램 이 오류 출력 에 오류 정 보 를 출력 할 수 있 도록 합 니 다.줄 이 태그 로 해석 되면 XML 문서 의 요소 로 XML 문서 에 추 가 됩 니 다.요소 에 들 어 가 는 줄 마다 기본 이름 라인 이 있 습 니 다.setDataLine Name()을 사용 하여 이름 을 지정 할 수도 있 습 니 다.모든 데이터 기록 은 하나의 열 요소 이 고 열 요소 의 이름 은 해당 하 는 구조 함수 에 의 해 제공 되 며 하위 요 소 는 줄 요소 에 추 가 됩 니 다.입력 한 데 이 터 를 완전히 읽 은 후에 효과 적 인 XML 문 서 를 얻 었 습 니 다.이 문 서 를 더 처리 할 수 있 습 니 다.현재 데 이 터 는 모두 가 알 고 있 는 나무 모양 구조 로 구성 되 어 있 기 때문에 처리 가 매우 간단 하 다.예 를 들 어 이 문 서 를 제3자 에 게 보 낼 수 있 습 니 다.제3자 가 이 문서 의 문서 형식 정의(Document Type Definition,DTD)를 알 면 쉽게 문 서 를 처리 할 수 있 습 니 다.이 문 서 를 저장 하기 위해 writeDocument(Document doc,OutputStream osOut)방법 을 사용 할 수도 있 습 니 다.코드 목록 D 는 XML 문 서 를 파일 에 저장 하 는 예 를 보 여 줍 니 다.XSLT 변환 으로 데 이 터 를 볼 수 있 고 XML 데 이 터 를 다른 형식 으로 변환 하여 다른 보기 로 내용 을 표시 할 수 있 습 니 다.가장 쉬 운 방법 은 XSLT 변환 을 사용 하 는 것 입 니 다.트 리 를 위 한 강력 한 변환 언어 를 제공 합 니 다.하나의 어휘 표를 사용 하 는 XML 인 스 턴 스 를 간단 한 텍스트,HTML 또는 다른 어휘 표를 사용 하 는 XML 로 변환 할 수 있 습 니 다.주어진 XML 입력 을 XSLT 언어 로 원 하 는 출력 을 만 들 수 있 습 니 다.예 를 들 어 transformData(InputStream xmlIn,InputStream xslin,OutputStream transfOut)를 실행 하면 XML 데 이 터 를 HTML 문서 로 변환 할 수 있 습 니 다.코드 목록 E 는 XSLT 변환 의 예 를 제공 하고 목록 F 는 주소록 항목 의 HTML 보 기 를 제공 합 니 다.데이터 에 대한 관 리 를 간소화 하고 본 논문 에서 우 리 는 PlainTextToXml Formatter 류 를 분석 함으로써 자주 사용 하 는 형식 데 이 터 를 XML 문서 로 변환 하 는 방법 을 배 웠 다.XSLT 변환 을 통 해 XML 문 서 를 다른 보기 로 표시 하 는 방법 도 보 았 다.각종 형식의 데 이 터 를 처리 해 야 할 때 상술 한 기술 을 받 아들 이 는 것 이 좋 은 해결 방안 일 수도 있 고 귀중 한 시간 을 절약 하 며 실수 할 가능성 을 줄 일 수 있다.

좋은 웹페이지 즐겨찾기