Excel을 기반으로 Gephi의 CSV 데이터 준비

2621 단어 그림 계산

기사 목록

  • Excel 기반 Gephi CSV 데이터 준비
  • 머리말
  • 원시 데이터
  • 준비 지점 데이터
  • 준비 모서리 데이터
  • CSV 데이터 가져오기
  • 후기
  • 참조 문서
  • Excel을 기반으로 Gephi의 CSV 데이터 준비


    앞말


    Gephi에 포인트 데이터(Nodes)와 사이드 데이터(Edges)를 준비해야 Gephi를 사용하여 시각화 그림 분석을 할 수 있습니다.
    본고는 Excel에서 원시 데이터를 점 데이터와 사이드 데이터로 변환한 다음Gephi로 가져오는 방법을 설명한다.

    원본 데이터


    일반적으로 원본 데이터는 표 구조로 줄마다 하나의 데이터를 나타내고 주열을 제외하고 다른 속성 열도 있다.
    예를 들어 한 기업은'기업명칭'을 위주로 하고 속성열은 법정대표자, 주주1, 지분비율1, 주주2, 지분비율2, 집행감사와 이사를 포함한다.

    준비점 데이터


    원본 데이터 Excel에 "Nodes"라는 시트를 새로 만듭니다. 정의 열: Id, Label, Type.
    원본 데이터의 모든 열 데이터를 Nodes sheet의 Label 열로 복사합니다. 형식과 원본 데이터가 일치하는 것을 주의하십시오.
    Nodes sheet에서 Label 열을 선택하고 [데이터]/[중복 제거 열]을 선택하여 중복 값을 삭제합니다.
    Label 열에서 빈 값을 필터링하고 삭제합니다.
    Id열에서 1, 2를 채우고 Excel의 자동 채우기 기능을 사용하여 Id열을 채워서 Id가 점차적으로 증가하고 중복되지 않도록 합니다.
    Type 열에 주석을 표시하는 유형, 예를 들어 기업이나 자연인.
    Nodes 시트를 Nodes로 저장합니다.csv.

    준비 모서리 데이터


    원본 데이터 Excel에'Edges'라는 시트를 새로 만듭니다. 정의 열: Source, Target, Label, Weight.
    Nodes sheet 뒤에 Id 열을 새 열(예: D 열)로 복사합니다.
    원본 데이터sheet 뒤에서 열 이름을 새 열로 복사합니다.
    새 열에서 VLOOKUP 함수를 사용하여 Nodes sheet 연관 찾기점 Id:
    첫 번째 열 엔터프라이즈 이름 값은 다음과 같습니다.
    # 3 Nodes sheet Id 
    =VLOOKUP(A2,Nodes!B:D,3,FALSE)
    

    두 번째 열의 값은 다음과 같습니다.
    =VLOOKUP(B2,Nodes!B:D,3,FALSE)
    

    이와 같이 관련하여 모든 새 열의 값을 찾습니다.
    새 열의 엔터프라이즈 이름을 Edges sheet의 Source 열로 복사한 다음 두 번째 열의 값을 Edges sheet의 Target 열로 복사하고 두 번째 열의 열을 Edges sheet의 Label 열로 복사합니다.
    이와 같이 모든 새 열을 Edges sheet의 Target 열로 복사합니다.
    연결할 수 없는 N/A 값을 삭제합니다.
    Weight를 모두 1로 채웁니다.
    Edges 시트를 Edges로 저장합니다.csv.

    CSV 데이터 가져오기


    Gephi의 데이터 자료에서 점을 선택하고 입력 스프레드시트를 선택하여 Nodes를 가져옵니다.csv, 인코딩을 중국어 인코딩(예를 들어 GB18030)으로 선택하여 중국어 혼란을 피합니다.
    그림의 형식(예를 들어 무방향 그림)을 선택하고, 통합 정책은 Dontmerge이며, Append to existing workspace를 선택하십시오.
    이와 유사하게 Edges를 선택합니다.csv는 모서리 데이터를 가져오고, Dontmerge로 병합 정책을 선택하여 평행 모서리 문제를 해결합니다.

    후기


    수동으로 Excel을 통해 원시 데이터를 점 데이터와 사이드 데이터로 변환할 수 있을 뿐만 아니라, 판다스 라이브러리를 사용하여 프로그래밍을 통해 표 데이터를 점 데이터와 사이드 데이터로 변환할 수 있다.

    참조 문서

  • http://humnviz.blogs.bucknell.edu/files/2015/11/Data-Preparation-for-Gephi.pdf
  • 좋은 웹페이지 즐겨찾기