일본 정치인 출신 대학 순위

4921 단어 SPARQLwikidatalod
※ 후술 조회의'대학 판단 일람표'부분을 ?univ wdt:P31 wd:Q3918.에서 ?univ wdt:P31/wdt:P279* wd:Q3918.로 변경합니다. 이에 따라 wd:Q3918(University)의 하급 등급도 고려됩니다.
도쿄 LOD 워크숍에서 SPARQL의 손잡이가 열린 다음날 트위터에서
새 내각 구성원을 보면 최종 학력이 지방 대학이 없는 것 같아요. 살짝 조사해 보니 다들 도쿄 도내 대학 출신이고 교토 대학도 없는 것 같아서 놀랐어요. - Norihiko Matsumura(@nmatsu150)2017년 8월 3일.
이런 광경을 보았다.
글쎄요. 마침 SPARQL의 해슨이 만든'위키데이터를 이용한 대졸자 차트'의 예가 있는데 조사 결과에 가깝다고 생각해서... 시험 결과를 공유합니다.

위키백과


Wikidata는 위키백과와 같은 위키미디어 컨소시엄이 운영하는'누구나 편집할 수 있는 무료 지식 기반'으로 현재는 위키백과 기사별로 해당 데이터의 링크(메뉴의'위키데이터 프로젝트'링크로 갈 수 있다)가 있다.
이 지식을 바탕으로 https://query.wikidata.org/에서 각종 조회를 수행할 수 있는 서비스가 있으며 조회 언어SPARQL로 조회할 수 있다.
위키백과 해설은 여기. 글을 필두로 Qitawikidata에도 있다.
검색하면 다양한 해설이 있으니 참고하세요.

순위 조회


그렇다면 이 제목의'위키백과를 사용하는 일본 정치인의 졸업 대학 순위'가 바로 여기에 있다.
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
PREFIX wd: <http://www.wikidata.org/entity/>

select ?univ ?univl (count(?s) As ?c) where{
?univ wdt:P31/wdt:P279* wd:Q3918.
?s  wdt:P27  wd:Q17;
    wdt:P106 wd:Q82955;
    wdt:P69  ?univ.
OPTIONAL{
    ?s  rdfs:label  ?name.
    FILTER(lang(?name)="ja")
    ?univ rdfs:label ?univl .
    FILTER (lang(?univl) = "ja") .
  }
}
GROUP BY ?univ ?univl
ORDER BY DESC(?c)
LIMIT 100
실행 결과는 여기.에서 확인할 수 있다.
Wikidata의 쿼리 서비스에서 준비한 차트 시각화 기능을 보면 다음과 같습니다.

예상대로 도쿄대는 졸업생이 많다.
이 결과 10위권 안에 드는 대학이 바로 이런 느낌이다.
대학.
그 대학 출신의 일본 정치가의 수
동경대학
1924
와세다대학
446
경응의숙대학
426
교토 시
235
중앙대학
232
오사카 대학
185
일본 대학
160
메이지 대학
144
일교대학
110
동북대학
106
개인적으로 의외로 우리 모교도 10위권에 들었다.
또 이 조회를 조금만 수정하면 각종 조사를 할 수 있다.
예를 들어 다음wdt:P39 wd:Q274948;의 한마디를 더하면'위키데이터를 사용한 일본 총리대신의 졸업대학 순위'다.
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
PREFIX wd: <http://www.wikidata.org/entity/>

select ?univ ?univl (count(?s) As ?c) where{
?univ wdt:P31/wdt:P279* wd:Q3918.
?s  wdt:P27  wd:Q17;
    wdt:P106 wd:Q82955;
    wdt:P39  wd:Q274948;
    wdt:P69  ?univ.
OPTIONAL{
    ?s  rdfs:label  ?name.
    FILTER(lang(?name)="ja")
    ?univ rdfs:label ?univl .
    FILTER (lang(?univl) = "ja") .
  }
}
GROUP BY ?univ ?univl
ORDER BY DESC(?c)
LIMIT 100

결과는 다음과 같다.
(Wikidata 웹 사이트에서 보고 싶은 경우여기.
대학.
그 대학 출신의 일본 총리 대신의 수
동경대학
30
와세다대학
6
교토 시
6
스탠퍼드 대학교
4
남 캘리포니아 대학교
4
경응의숙대학
3
상지대학교
3
런던 경제 연구소
2
학원
2
메이지 대학
2
일교대학
2
사이타마대학
2
동경공업대학
1
수상 대학
1
동경제국대학
1
파리 대학교
1
중앙대학
1
동경해양대학
1
오사카 대학
1
성성대학
1
신호대학
1
1위가 도쿄대라는 것은 변함없지만 다음과 같은 변화가 크다.
또한 이러한 쿼리를 작성하는 데 걸리는 시간은 총 15분 정도입니다.
이렇게 하면 여러 가지 일을 편리하게 조사할 수 있어 흥미로운 곳이다.

주의점


위 차트는 항상 Wikidata에 등록된 데이터를 기반으로 합니다.
위키데이터는 위키백과와 마찬가지로 커뮤니티를 기반으로 구축되기 때문에 반드시 정확한 정보가 있는 것은 아니다.
또 이번에 작성된 질의에서는 한 사람이 여러 대학에서 교육을 받으면 중복 계산된다.
이 점에서 조회에 더 신경을 쓰면 방법(최종학력 계산 등)이 있을 수 있지만 데이터가 어디로 입력됐는지도 봐야 한다.
다만 위키데이터에는 위키백과 글의 항목이 상당히 많은 데이터를 덮어쓰고, 무심코 느낀 것은 데이터에 따라 간단하게 조사할 때 편리하다.

상세 조회 쓰기


이 글에서 상세한 조회 기법은 설명을 생략했지만 관심 있으신 분들은
제1회 링크드 오픈 데이터(LOD) 활용 워크숍 자료 방치장
https://github.com/KnowledgeGraphJapan/LODws1st
세미나에서 설명한 자료와 샘플이 있으니 보십시오.
또 위키백과와 같은 조회의 지식 기반을 활용한 DBpedia의 순위 조회에 관해서는 여기 기사.에서 설명했으니 함께 보시기 바랍니다.
물론 프로그램 접근https://query.wikidata.org/sparql의 주소로 접근)도 가능하지만, 조금만 공을 들이면 다양한 일에 활용할 수 있을 것 같아서요.

좋은 웹페이지 즐겨찾기