HDF5 파일의 시각화 & CSV 변환 툴을 만들어 보았다

개요



HDF5 파일을 GUI로 시각화하고 CSV 출력하는 툴을 C#으로 작성해 보았습니다.

요청, 버그 등 있으면, 코멘트 받을 수 있으면 기쁩니다!

HDF5란?



계층 구조를 유지할 수 있는 파일 형식으로,
AI·기계 학습의 모델 보존용으로 자주 이용되고 있다고 합니다.
여기에 따르면 , 아래와 같은 장점과 단점이있을 것 같습니다.

장점



・계층 구조를 가지기 때문에, CSV등에서는 복수로 분할되는 데이터를 1개의 파일로 보관 유지할 수 있다
· 읽기 속도가 CSV 등보다 빠릅니다.
· 여러 언어로 사용 가능 (Pickle과 같이 Python 전용이 아님)
・압축이나 부분 읽기 등, 고속화나 저용량화를 위한 소기술이 충실하다

단점



・Excel등의 범용 툴에서는 열 수 없다
· 다른 파일로 변환하기 쉽지 않음

HDF5와 시각화



HDF5 파일은 기본적으로 Python에서의 읽고 쓰기를 전제로 하기 때문에, CSV 파일과 같이 Excel로 부담없이 내용을 확인, 같은 것은 할 수 없습니다.
일단 공식 시각화 도구 가 있습니다만, 등록이나 인스톨이 필요하거나, GUI가 낡아지거나라고, 쓰기는 그다지 좋지 않습니다.

그래서 이번 C#에서 GUI에 의한 HDF5 파일 시각화 툴을 자작해 보았습니다

시각화 도구 개요



C#(.NET)용 HDF5 라이브러리, HDF5DotNet을 사용하고 있습니다.
표시용의 데이터 작성은 여기 를 참고로 했습니다.
현재는 Windows 전용입니다만, 희망이 있으면 다른 OS 대응 버전도 만들려고 합니다

코드 위치



여기에서 다운로드하십시오.
컴파일 방법 등은 ReadMe에 기재되어 있습니다

사용법



1. HDF5 파일을 드래그 앤 드롭


2. 원하는 최상위 그룹을 클릭하면 하위 그룹 데이터가 나열됩니다.
(그룹 이름은 베이지 색이고 데이터 이름은 녹색으로 표시됩니다)


3. 뒤로를 더블 클릭하면 상위로, 그룹명을 더블 클릭하면 하위 그룹으로 이동할 수 있다.


※표시법 「모든 데이터」를 체크하면, 모든 데이터가 일람 표시된다


4. 데이터 이름을 더블 클릭하면 데이터 내용이 표시됩니다.


5. "출력"클릭하면 데이터 내용을 CSV 출력할 수 있다
(모든 데이터 또는 표시 데이터 만 출력할지 인코딩을 선택할 수 있음)


이상입니다!
요청, 버그 등 있으면, 코멘트 받을 수 있으면 기쁩니다!

결론



이 도구가 좋다고 생각되면 GitHub에 Star 받을 수 있으면 고맙습니다!

좋은 웹페이지 즐겨찾기