인용하고 싶은 부분을 스쿠쇼 해 OCR도 해 Trello에 날리는 방법

논문을 읽으면서 「아, 이 근처 참조하고 싶다」라고 생각했을 때에, 즉시 스쿠쇼로 잘라서 Trello로 집적해 두는 쉘 스크립트입니다. 이미 evernote라든지 어쨌든 그런 편리한 클립 기능은 많이 있다고 생각합니다만, PDF 열람 소프트라든지 전자 서적 리더라든지, 브라우저 이외에서도 어쨌든 잘라내고 싶은 & Trello에 넣고 싶다고 하는 소망으로부터, 간이적인 쉘 스크립트를 써 봐 네.
  • 절차
  • 스쿠쇼 (gnome-screenshot)
  • 페이지 수나 키워드 등의 메모 작성 (yad)
  • OCR화(tesseract)
  • 이메일로 보내기(mutt)


  • 이상입니다. 요점은 Trello의 메일로 카드 추가하는 기능을 사용해 이미지를 첨부해 메일하고 있을 뿐. OCR은 덤입니다.

    덧붙여서 Trello의 메일 기능은 오른쪽 상단의 Show Menu에서 More를 클릭하면 Email-to-board Settings라는 것이 나오므로 그것을 사용합니다. mutt 설정은 생략합니다.
    
    #!/bin/sh
    
    CITATION=$HOME/{スクショの保存先}
    FILE=$CITATION/$(date "+%Y%m%d-%H%M%S").jpg
    CONTENT=$CITATION/ocr.txt
    
    
    #スクショる
    gnome-screenshot --area --file=$FILE
    if [ ! -f "$FILE" ]; then exit 1; fi
    #メモる(yayのオプションはお好みで)
    SUBJECT=$(yad --width=1500 --posy=50 --posx=250 --entry --entry-label="Reference" --no-buttons --enable-spell --spell-lang=fr)
    #メモが空白だと自動的にキャンセルされ、取ったスクショも消える
    if [ -z "$SUBJECT" ]
        then
            notify-send "Abort"
            rm -rf $FILE
        exit 1
    else
    #OCRる(今回はフランス語に設定)
    tesseract $FILE stdout -l fra > $CONTENT
    #メーる
    mutt -s "$SUBJECT" {Trelloで設定されたカード追加用のメールアドレス} -a $FILE < $CONTENT
    notify-send "Success"
    fi
    
    

    그리고는 적당히 스크립트를 달리는 단축키를 할당합니다. 자신은 i3wm을 사용하고 있기 때문에 bindsym control+Shift+4 exec "~/.bin/trello-screenshot" 보고 싶은 설정하고 있습니다.

    스쿠쇼를 지정 디렉토리에 보관하도록 하고 있습니다만, 잘 생각하면 Trello에 보내지고 있기 때문에, 송신 후에 삭제하는 것이 좋을지도 모릅니다.

    예:



    OCR 걸리면 약간 반영이 느려지므로 불필요한 경우는 떼어 둡시다.

    모은 인용문을 하나의 목록에 넣습니다. 각 장마다의 리스트를 미리 만들어 두고, 필요한 곳에 터지면서 실제로 인용하는 부분을 OCR로부터 빼내거나, 고찰을 더해 가면 좋은 느낌의 논문 아웃라인이 완성됩니다.

    Trello는 짧은 간격으로 업데이트하면 잘 연결이 끊어지므로(Trello가 아닌 planyway측의 문제?), 집중적인 쓰기에는 적합하지 않지만, 칸반 형식으로 희미한 윤곽을 생각하기에는 적합하다 라고 생각합니다. 혼자 한다면 거의 무료라는 것도 고맙습니다.



    일단, 일본어도 시험해 보았습니다. 이하를 if문중에 추기해, 이름이 [jp]로부터 시작되는 것을 일본어로 인식시켜 보겠습니다.
    
    elif [[ "$SUBJECT" =~ ^[jp]* ]]
    then
    tesseract $FILE stdout -l jpn > $MCONTENT
    mutt -s "$SUBJECT" {Trelloで設定されたカード追加用のメールアドレス} -a $FILE < $CONTENT
    
    

    결과:



    원본 이미지:


    OCR:


    수수께끼의 공백과 수수께끼의 한자가 발생했습니다. 원본 이미지가 거칠기 때문일 수 있습니다. 세로 쓰기 파일도 마찬가지로 좋지 않았습니다.

    일본어 OCR 정밀도는 앞으로 기대됩니다.

    좋은 웹페이지 즐겨찾기