Mac (Catalina)에 Xpdf를 설치하여 일본어 지원

Mac에 Xpdf를 설치하는 방법을 조사했기 때문에 정리했습니다.

PDF 처리를 공부하는 동안 Mac에서 pdffonts 명령을 사용해야하기 때문에 pdffonts를 포함하는 패키지에 Xpdf를 설치하는 방법을 조사했습니다. 새로운 정보로 잘 어울리는 것이 없었기 때문에,이 기사를 읽고 여러분이 원활하게 Xpdf를 설치할 수 있기를 바랍니다.

환경


  • macOS Catalina 10.15.15
  • 패키지 관리자 Homebrew

  • Xpdf 설치



    Homebrew를 사용합니다.
    brew install xpdf
    

    종속 패키지가 많아서 조금 시간이 걸렸습니다. 최근에는 brew install 그러면 자동으로 update 해주네요.

    일본어 표시



    언어 패키지 다운로드



    바로 명령을 시도해 보겠습니다. 일본어를 포함한 파일로 시도해 봅니다.
    > cd ~/testDir
    > pdffonts test.pdf
    
    Syntax Error: Unknown character collection 'Adobe-Japan1'
    

    오류가 발생합니다. 일본어를 보려면 Language support package를 다운로드해야 하는 것 같습니다.

    Download Xpdf and XpdfReader에서 Japan 패키지를 다운로드합니다.

    /usr/local/share/xpdf/japanese 디렉터리를 만듭니다.
    방금 다운로드한 일본어 패키지를 압축 해제하고 내용을 /usr/local/share/xpdf/japanese로 옮깁니다.
    이것만으로는 아직 일본어 표시할 수 없습니다. 구성 파일을 만들어야 합니다.

    설정 파일 만들기


    ~/.pdfrc 파일을 만듭니다(자신은 이 파일명을 .pdffrc로 해서 빠졌습니다). 이 파일에 이전에 압축을 푼 텍스트 텍스트 add-to-xpdfrc의 내용을 추가합니다. 또한 textEncoding UTF-8도 추가합니다.

    ~/.pdfrc
    textEncoding UTF-8
    
    #----- begin Japanese support package (2011-sep-02)
    cidToUnicode    Adobe-Japan1    /usr/local/share/xpdf/japanese/Adobe-Japan1.cidToUnicode
    unicodeMap  ISO-2022-JP /usr/local/share/xpdf/japanese/ISO-2022-JP.unicodeMap
    unicodeMap  EUC-JP      /usr/local/share/xpdf/japanese/EUC-JP.unicodeMap
    unicodeMap  Shift-JIS   /usr/local/share/xpdf/japanese/Shift-JIS.unicodeMap
    cMapDir     Adobe-Japan1    /usr/local/share/xpdf/japanese/CMap
    toUnicodeDir            /usr/local/share/xpdf/japanese/CMap
    #fontFileCC Adobe-Japan1    /usr/..../NotoSansCJKjp-Regular.otf
    #----- end Japanese support package
    

    다른 옵션이 필요하다면 xpdfrc 을 참고하십시오. 이제 일본어를 포함한 PDF를 다룰 수 있게 되었습니다. 예를 들어 글꼴 정보를 보면 다음과 같습니다.
    > pdffonts example.pdf
    
    name                                           type              emb sub uni prob object ID
    ---------------------------------------- ----------------- --- --- --- ---- ---------
    IMEOLT+Century                           TrueType          yes yes no            8  0
    FJHSNS+HiraMinPro-W3                     CID Type 0C       yes yes no            9  0
    UBNOQH+PalatinoLinotype-Italic           TrueType          yes yes yes          11  0
    

    참고 링크
  • pdf에 글꼴이 포함되어 있는지 확인하는 명령 pdffonts - 녹아! 임시증간호
  • xpdf를 사용하여 PDF에서 일본어 추출 | akkunchoi@github

  • 빠진 곳



    언어 패키지를 어디에 두는지



    Homebrew로 설치했기 때문에 /usr/local/Cellar/xpdf 이하에 언어 패키지를 둘 필요가 있을까라고 미주했습니다. 결론으로서는 어느 쪽이라도 좋지만, /usr/local/share 에 두는 것이 조금 베터라고 생각하고 있습니다. 근거는 Homebrew에서 관리하는 것에 손을 넣는 것은 좋지 않을 수 있기 때문입니다.

    설정 파일 위치



    조사한 범위에서는 설정 파일을 /usr/local/etc/xpdfrc 라고 하는 사이트 뿐이었습니다 (일본어에서는). 그냥 공식 xpdfrc을 읽어 보면

    All of the Xpdf tools read a single configuration file. If you have a .xpdfrc file in your home directory, it will be read. Otherwise, a system-wide configuration file will be read from/usr/local/etc/xpdfrc, if it exists. (This is its default location; depending on build options, it may be placed elsewhere.)

    요약하면
  • ~/.xpdfrc 가 있으면 읽어들입니다. 이곳은 사용자별 설정.
  • 없으면 /usr/local/etc/xpdfrc를 읽습니다. 이곳은 시스템 전체 설정.

  • 개인적으로는 사용자마다 설정을 바꿀 가능성을 생각하기 때문에, ~/.xpdfrc 를 설정 파일로 했습니다.

    이상, 어쩔 수 없는 빠진 곳이었습니다.

    좋은 웹페이지 즐겨찾기