연어 런 통계: 매치메이킹(4부)

5377 단어 showdevpython


안녕하세요 여러분.
이번에는 매치 메이킹에 관한 Salmon Run의 새 게시물로 돌아왔습니다.

상단에 큰 그래프가 보이시나요?
이것은 플레이어 순위가 x이고 경기의 위험 수준이 y인 산점도입니다.
그런 다음 그래프에 선형 회귀를 배치했습니다.
이 그래프에서 중요한 고려 사항은 제목에서 제목으로 이동하는 데 필요한 포인트 수이므로 각 제목의 가치를 100으로 설정한다는 것입니다.

이 그래프에서 선의 방정식은 다음과 같습니다.

y = 0.111x + 50.691



이 그래프를 만든 방법:
scripts/rank_and_danger_rate.py 파일에서 했습니다.

data = core.init("All")
x = []
y = []


먼저 데이터 세트를 준비하고 x 및 y 값을 저장할 빈 목록을 만듭니다.

with gzip.open(data) as reader:
    for job in jsonlines.Reader(reader, ujson.loads):
        if "title" in job and "title_exp" in job and job["title"] is not None:
            x.append(job["title"]["splatnet"] * 100 + job["title_exp"])
            y.append(float(job["danger_rate"]))


여기서 우리는 데이터 세트에서 관심 있는 것을 수집합니다.

plt.scatter(x, y)
plt.xlabel("Rank")
plt.ylabel("Hazard Level")


이제 산점도를 준비합니다.

m, b = numpy.polyfit(x, y, 1)
y_equation = list(sorted([x_val * m + b for x_val in x]))
print("y = {:4}x + {:4}".format(m, b))
plt.plot(list(sorted(x)), y_equation)
plt.show()


선형 회귀를 만들고 플로팅하고 그래프를 표시합니다.

좋은 웹페이지 즐겨찾기