파이썬에서 성경의 빈번한 단어 계산
0. 실현하기
마지막 기사 의 파이썬 버전입니다.
성경의 빈출 단어를 계산합니다.
1. 환경
MacbookPro
Python3
Jupyter notebook
2. 데이터 얻기
Github에 게시된 데이터를 빌릴 수 있습니다.
bible.txt
폴더에 저장합니다.
3. Jupyter notebook 시작
성경 데이터를 저장한 폴더에서 jupyter notebook을 시작합니다.
jupyter notebook을 install하지 않은 분은 다른 사이트를 참고하십시오.
【2019년 5월】MacBook에 Jupyter Notebook을 설치한다 (macOS 10.14.4/Mojave)
4. Code
read_bible.ipynb
import re
import collections
path = "./bible.txt"
with open(path) as f:
s = f.read()
# データの整形
s = re.sub(r'[,.:;"?() ]', " ", s)
s = re.sub('\n', " ", s)
s = s.lower()
s = s.split()
s = sorted(s)
# 頻出語をカウント
counter = collections.Counter(s)
counter.most_common()
5. 메모
문자열 처리 연습이었습니다.
Reference
이 문제에 관하여(파이썬에서 성경의 빈번한 단어 계산), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/youichi_io/items/35725cb845f84993746a텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)