대폭발의 정리를 검증했습니다. [거의 집에 갈 뻔 했겠지?]

대폭발의 정리는..


어떤 언어든지'대폭발'이라는 표현으로 귀결될 수 있다

인용하다


어떤 단어든 사전에서 그 뜻을 거슬러 올라가 우주 대폭발에 도달했다는 주장을 검증해 봤다.
https://www.youtube.com/watch?v=CN7q1thA7mU

이루어지다


이번에 "Media Wiki API"를 사용하여 기사에 링크된 기사 목록을 가져옵니다.
얼마나 많은 문장이 대폭발 보도에 연결될 수 있는지 검증하다

출처


python
url = "http://ja.wikipedia.org/w/api.php"
payload = {"format":"json", "action":"query", "list":"backlinks", "blnamespace":"0"}
payload['bltitle'] = word
r = requests.get(url, params=payload)

# json整形
json_load = r.json()
json_load = json.dumps(json_load)
json_load = json.loads(json_load)

# 一部切り出し
json_load = json_load['query']['backlinks']

theList = []
# 記事分をループ
for value in json_load:

    theDict = {}
    theDict['id'] = value['pageid']
    theDict['title'] = value['title']

    theDict['blTitle'] = word

    theDict['url'] = 'https://ja.wikipedia.org/wiki/' + value['title']
    theDict['floor'] = floor
    theDict['ns'] = value['ns']

    theList.append(theDict)

dataFrame = pd.io.json.json_normalize(theList)

참고 자료


검증 결과


https://ja.wikipedia.org/wiki/Wikipedia:일본어 버전 통계
총 기사 수는 12227198건이다.
※ 2020년 9월 현재

n=대폭발 전 복귀 횟수

대표 값


n=0
대폭발
n=1
물리학
연표
우주론
n=2
지리학
생물
생물학

결과 CSV 내보내기


모두 결과 가져오기(중복 기사)
https://github.com/Syogo-Suganoya/bigBanete/blob/master/downloads/record.csv
모든 결과 가져오기 (문장이 중복되지 않음)
https://github.com/Syogo-Suganoya/bigBanete/blob/master/downloads/uniqueRecord.csv

결론


10차 시험에서 문장 링크의 순환이 발생하여 문장 망라율이 정점에 이르렀다.
대폭발적인 일본어 보도의 망라율(대폭발율)은 0.0993%이다
'어떤 언어든'대폭발'로 돌아간다'는 명제는 잘못된 것이다.

github

좋은 웹페이지 즐겨찾기