파이썬에서 성경의 빈번한 단어 계산

0. 실현하기



마지막 기사 의 파이썬 버전입니다.

성경의 빈출 단어를 계산합니다.


1. 환경



MacbookPro
Python3
Jupyter notebook

2. 데이터 얻기



Github에 게시된 데이터를 빌릴 수 있습니다.
bible.txt

폴더에 저장합니다.

3. Jupyter notebook 시작



성경 데이터를 저장한 폴더에서 jupyter notebook을 시작합니다.
jupyter notebook을 install하지 않은 분은 다른 사이트를 참고하십시오.

【2019년 5월】MacBook에 Jupyter Notebook을 설치한다 (macOS 10.14.4/Mojave)

4. Code



read_bible.ipynb
import re
import collections

path = "./bible.txt"

with open(path) as f:
    s = f.read()

# データの整形
s = re.sub(r'[,.:;"?() ]', " ", s)
s = re.sub('\n', " ", s)
s = s.lower()
s = s.split()
s = sorted(s)

# 頻出語をカウント
counter = collections.Counter(s)
counter.most_common()

5. 메모



문자열 처리 연습이었습니다.

좋은 웹페이지 즐겨찾기