longcat에게 데이터 분석 PJ의 위기를 구해준 이야기 【클러스터링의 가시화】

소개



안녕하세요.
zaicoban 이라는 서비스의 제품 소유자&데이터 분석을 담당하고 있는, 가운데입니다.
갑자기이 고양이 넷에서 본 적이 없습니까?


귀엽네요.
노비루탄이나 longcat이라고 불립니다.
실은, 올해와 어느 PJ의 데이터 분석 안건으로 이 longcat에 아슬아슬한 궁지를 구해진 적이 있어,
그 때의 노하우를 공유하고 싶습니다.

어느 날 어느 PJ에서



일의 시작
상사:「300 점포를 매출 구성이 가까운 가게마다, 좋은 느낌 어렵고 싶지만」
나: 「클러스터링이군요―. 수형도적인 녀석이 좋을 것 같네..」

~~작업~~
from scipy.cluster.hierarchy import linkage, dendrogram
import matplotlib
import matplotlib.pyplot as plt
import pandas as pd

# サンプル
df = pd.read_csv('longcat_sample.csv')
labels = df['id'].astype(str).values

plt.rcParams['font.family'] = 'AppleGothic'
plt.rcParams['font.family'] = 'MS Gothic'

plt.figure(figsize=(80,5))

result1 = linkage(df.iloc[:,1:5], 
                  metric = 'euclidean', 
                  method= 'average')
dendrogram(result1,labels=labels)
plt.show()



나:「토리마 페롯과 할 수 있었습니다ー」
상사: "오. 하지만 보기 어려우니까 뭔가 좋은 느낌으로 해."
  「어쩐지, 이렇게 둥글게 하면 좋다―.후 2시간 정도로 자료로서 사용하고 싶으니까 잘부탁해.」
나:「후우ー

매우 곤란했습니다.
클러스터링의 결과로, 옆으로 길다고 보기 어렵다는 것은 확실히 그렇습니다.
만들어야 할 이미지는 알겠지만, 라이브러리 안에 그런 것 없을 것 같고,
구구라고 해도 뭔가 조금 방향이 다른 것 밖에 나오지 않고. . .
어떻게 든 이것. . .

초조해 여러가지 굳어져도, 바삭바삭할 수 있는 방법을 찾을 수 없고,
그냥 시간이 없어져 간다. . .

그 때 문득 뇌리를 지나가는 작년의 어드벤트 캘린더( @ 야미_돼지씨).
htps : // 코 m / 야미 _ 돼지 / ms / 후 fb8c3dfb8057266 예 5


작년의 어드벤트 캘린더 중에서도, 개인적 최우수상의 기사입니다.
그 때는 그냥 슈퍼 우케한다! 라고 생각해 주셨습니다만,
문득,
「클러스터링도 옆에 길기 때문에, 어쩌면 「돌아가는 긴 고양이」인 것은. . . ? "
라는 천계가.

어쩔 수 없이 해보면. . .
convert  ~/Downloads/result_sonomama.png -flatten -rotate -180 -distort arc 360  ~/Downloads/result_sonomama_test.png



아, 이거 왔잖아. . .
선이라든지 테두리라든지 조정하면. . .
matplotlib.rcParams['lines.linewidth'] = 5 
plt.figure(figsize=(80,5))
result1 = linkage(df.iloc[:,1:5], 
                  metric = 'euclidean', 
                  method= 'average')
dendrogram(result1,labels=labels,leaf_font_size=12,leaf_rotation=90,)
plt.tick_params(labelleft=False, labelright=False, labeltop=False,left=False)
plt.gca().spines['right'].set_visible(False)
plt.gca().spines['left'].set_visible(False)
plt.gca().spines['top'].set_visible(False)
plt.gca().xaxis.set_ticks_position('bottom')
plt.show()



이것을!


왔다 아아

게다가 클러스터링을 돌릴 수 있다! 대단해! ! 의미 없다! ! ! 슈퍼 우케! ! !
eval "convert -delay 10 ~/Downloads/result_longcat.png -flatten -rotate -180 -write mpr:a +delete `for i in {230..4485..230};do echo -n "\( mpr:a -roll -$i+0 -distort arc 360 \) ";done`yattaa.gif"



상사:「longcat 신쨩」

클러스터링 결과를 파워포에 붙일 수 있고,
자료도 좋은 느낌이 되어 어떻게든 일 없는 것을 얻었습니다.



지금은 클러스터링 결과를 내는 것을 longcat한다고 합니다.
이미 longcat과 @ 야미_돼지 씨는 다리를 향해 잠을 잘 수 없습니다.

감사합니다 longcat, 감사합니다 yami_buta



슬프게도, 올해의 9월에 longcat(본명 시로씨) 죽었다. 라는 것입니다.
그에 쵸~ 늘어나는 길이와, 단지 돌는 용 모습에 굳어졌습니다, 감사합니다. . .
(모두는 @ 야미_돼지 씨 덕분에 감사드립니다)

여러분도 데이터 분석의 출력으로 곤란하면 longcat 해 보세요.

음, 잘 생각하면 opencv에 좋은 설은 있다.

좋은 웹페이지 즐겨찾기