내 Windows C 디스크에서 가장 큰 파일을 발견했습니다.

동기 부여



로컬 디스크에서 가장 큰 파일이 무엇인지 궁금한 적이 있습니까? 저도 그랬습니다. 그러나 동시에 두 가지 제약을 염두에 두었습니다.
  • 타사 도구를 사용하여 디스크 스캔을 처리하고 싶지 않았습니다.
  • 수동으로 스캔하지 않을 생각이었습니다.

  • 이 기사에서는 내가 어떻게했는지 단계별로 보여줍니다. 하지만 시작하기 전에 매우 만족스러운 최종 Tableau 데이터 시각화를 보여드리겠습니다!

    데이터비즈 결과



    최초의 데이터 시각화







    유용성별로 그룹화된 확장 총 크기


    인사이트
  • 확장자(왼쪽 하늘색)가 없는 파일이 많습니다.
  • Unreal Engine 아카이브의 ucas 파일은 Fortnite를 플레이할 때 실제로 의미가 있습니다.
  • vsix 파일은 일부 시각적 코드 확장입니다. 나는 아직도 그들이 내 컴퓨터에 어떻게 들어왔는지 궁금합니다. Sublime 텍스트만 메인 에디터로 사용합니다...
  • 이 차트에 표시될 때까지 내 PNG 사진이 얼마나 큰지 깨닫지 못했습니다.

  • 두 번째 데이터 시각화







    유용성별로 그룹화된 총 크기 및 파일 수를 포함하는 확장 프로그램


    인사이트
  • 평균적으로 OS 파일은 비 OS 파일보다 큽니다.
  • 확장자가 없는 파일이 150,000개 이상 있습니다(OS용이라고 가정했지만 누가 압니까?).
  • ucas 파일이 171개뿐이므로 1개의 ucas 파일이 평균보다 큽니다.
  • 솔직히 vsix 파일에서 사용하는 쓸모없는 2Gb를 제거해야 합니다.

  • 세 번째 데이터 시각화







    폴더 깊이당 파일 수


    인사이트
  • 24개 수준의 폴더가 있으며 첫 번째 폴더는 디스크 자체입니다C:/.

  • 가장 많이 사용되는 디렉토리는 일반적으로 4번째에서 12번째 깊이 사이입니다.

  • 6단계에는 많은 파일이 포함되어 있지 않습니다. 이 폴더 깊이에는 하위 디렉토리만 있어야 합니다.

  • 네 번째 데이터 시각화







    유용성별로 그룹화된 폴더 깊이

    1 도트 = 1 파일

    1색 = 1폴더

    Y축 = 1부터 시작하여 위에서 아래로 폴더 깊이


    인사이트
  • 아래로 내려갈수록(디렉토리 깊이가 커질수록) 파일의 양이 줄어듭니다.
  • 비 OS 파일에 생성된 빈 공간은 전용 OS 폴더를 나타냅니다.

  • OS 파일 중에서 크게 늘어선 영역은 Microsoft 서비스 파일을 나타냅니다.
    ![os-폴더-1][os-폴더-1] ![os-폴더-2][os-폴더-2]

  • 비 OS 파일 중에서 큰 분홍색 및 녹색 선은 모든 캐싱 프로세스가 발생하고 저장되는 %AppData% 하위 폴더를 나타냅니다.
    ![핑크라인][핑크라인]

  • 나는 그것을 어떻게 했는가?



    파일 세부 정보 수집



    위의 최종 시각화를 수행하기 전에 첫 번째 단계는 분명히 데이터를 수집하는 것입니다. 내 cmd 터미널에서 다음 두 줄 코드를 사용했습니다.

    cd C:/
    where "*.*" /r . /t > f:\list-of-c-files.txt 
    


    Note that the output file is stored out of the scanned disk so that it doesn't interfer while scanning.



    초기 출력



    출력은 아래와 같습니다.

    꽤 못 생겼죠? 청소 좀 합시다.

    데이터 정리



    이 단계는 원하는 소프트웨어나 프로그래밍 언어로 수행할 수 있습니다. 제 경우에는 Tableau Software를 직접 사용했습니다.
  • 사용하지 않는 임의의 문자를 구분 기호로 사용하여 초기 파일을 텍스트 파일로 가져옵니다. 이러한 방식으로 원시 데이터에서 모든 새로운 계산된 필드를 수동으로 사용자 지정할 수 있습니다. 제 경우에는 Tableau Software Desktop의 이 (프랑스어 버전) 스크린샷에 표시된 대로 ^를 사용했습니다.
  • 새 계산 필드를 모두 만들고 단일 원시 열src_all을 숨깁니다.

  • 최종 출력 데이터를 미리 보고 모든 것이 예상한 것과 일치하는지 확인합니다.


  • 그게 다야, 우리는 ready to dataviz !

    자신의 파일을 미리 보려면...



    저에게 전화만 주시면 신속하게 시작할 수 있도록 기꺼이 Tableau 템플릿을 제공해 드리겠습니다!

    아래 댓글 섹션에서 이 사이드 프로젝트에 대한 귀하의 생각을 자유롭게 말씀해 주십시오.

    좋은 웹페이지 즐겨찾기