Python을 사용하여 독서 습관 조각내기

나는 우리 동네 도서관을 사랑한다. 아내가 휴대전화로 책 읽는 것을 좋아하는 만큼(저희 도서관보다 온라인에서 중국어 책을 더 많이 구할 수 있기 때문에 저는 그녀에게 패스를 제공합니다.) 저는 단어의 단단한 느낌을 손에 넣어야 합니다.

그것은 또한 내가 전자 제품에서 한 발짝 떨어져서 무언가 또는 다른 곳에 몰두할 수 있는 좋은 방법입니다.

책을 많이 읽다 보니 특정 책을 읽었는지, 아니면 시리즈물을 좋아해서 3번을 읽었는지 가끔 잊어버리곤 합니다. 7? 다음편 나오기를 기다리면서 어디를 갔을까?

다행히 도서관에서 내가 읽은 책 목록을 제공할 수 있습니다.

슬프게도 그 목록은 20개 이상의 행 중 2개만 필요한 메타데이터의 무리이므로 수동으로 검토하는 데 시간이 걸립니다.

다시 파이썬에 입문하고 싶었기 때문에 그것을 사용하여 레코드를 살펴보고 필요한 작성자와 제목만 얻기로 결정했습니다.

로 시작:Record 717 of 717
LOCATIONS TOWN & CITY
AUTHOR Younger, Heather R., author.
TITLE The art of caring leadership : how leading with heart uplifts
teams and organizations / Heather R. Younger.
EDITION First edition.
PUB INFO Oakland, CA : Berrett-Koehler Publishers, Inc., [2021]
DESCRIPT xvii, 193 pages : illustrations ; 23 cm.
DESCRIPT text txt rdacontent.

나는 단지 필요했다:AUTHOR Younger, Heather R., author.
TITLE The art of caring leadership : how leading with heart uplifts
teams and organizations / Heather R. Younger.

그래서 처음에는 전체 텍스트 덤프를 살펴보고 내가 가지고 있는 것을 보고 싶었습니다.

f = open("export.txt", "r")
print(f.read())
f.close()


하지만, 이런! 이상한 UTF 오류가 발생합니다! 여기에 새로운 것은 없습니다. 제어할 수 없는 소스에서 텍스트를 받을 때 많이 발생합니다. 그래서 약간 수정...

f = open("export.txt", encoding="utf8")
print(f.read())
f.close()


나는 그것을 저장하고 싶습니다. 그래서 나는 내가 원하는 것을 살펴볼 수 있고 아마도 내가 원하는 것에 대한 결과에서 텍스트 검색을 할 수 있습니다. 이는 작성할 때 인코딩을 보장하고 해당 두 줄만 가져오기 위해 정규식을 추가하는 것을 의미합니다. 내가 끝나는 곳 :

import io
import re

with io.open("readingList.txt", "a", encoding="utf8") as f:
    # Get only the two fields we care about
    for line in open("export.txt", encoding="utf8").readlines():
        if re.search("^AUTHOR", line) is not None:
            author = line.replace(", author.", "")
            f.write(author)
        elif re.search("^TITLE", line) is not None:
            title = line
            f.write(title)
f.close()


여기 있습니다. 이제 검색을 자동화할 수 있도록 파일을 저장하는 방법을 연구하거나 원하는 작성자만 입력할 수 있습니다. 그것은 또한 내가 몇 년 동안 사용하지 않은 언어로 되돌아갈 수 있는 좋은 방법이었습니다.

좋은 웹페이지 즐겨찾기