3 까다로운 통계 이야기

통계는 종종 오해의 소지가 있습니다. 여기에 예가 있습니다. 10개국의 억만장자 수를 살펴보세요.

💰 미국 - 585
💰 중국 - 476
💰 인도 - 131
💰 독일 - 114
💰 러시아 - 98
💰 홍콩 - 67
💰 캐나다 - 64
💰 영국 - 54
💰 브라질 - 43
💰 이탈리아 - 42

이 목록에서 우리는 미국이 분명히 여기에서 앞서고 있다고 안전하게 말할 수 있습니다. 아니면 우리가 할 수 있습니까? 이 숫자는 기본 비교인 억만장자와 nr을 비교하기 때문에 현실을 보여주지 않습니다. 나라마다 사람들이 다르다.

위의 목록에 있는 모든 국가에는 적어도 백만 명의 시민이 있기 때문에 백만 명당과 비교하기 위해 기준을 정규화하는 것이 훨씬 더 나은 메트릭이 될 것입니다.

아래 목록은 이를 보여줍니다.

👉 홍콩 ~8.93
👉 캐나다 ~1.70
👉 미국 ~1.6
👉 독일 ~1.37
👉 영국 ~0.81
👉 이탈리아 ~0.69
👉 러시아 ~0.67
👉 중국 ~0.3
👉 브라질 ~0.19
👉 인도 ~0.09

이 목록은 완전히 다른 그림을 보여줍니다. 우리는 하나를 정규화하는 두 차원을 다른 차원과 비교하고 평균을 계산했습니다.

평균이 오해의 소지가 있는 또 다른 경우는 직원 급여와 국가 또는 회사 전체 평균인데, 이는 회사에서 다음 급여를 받는 직원 5명을 취한다고 가정하기 때문에 매우 정확한 측정 기준이 아닙니다.

👶 직원 1 - 5,000.00 USD/월
👶 직원 2 - 5,500.00 USD/월
👶 직원 3 - 6,000.00 USD/월
👶 직원 4 - 12,000.00 USD/월
👶 직원 5 - 14,000.00 USD/월

평균적으로 우리는 직원이 한 달에 8,500.00 USD를 가지고 있다고 말할 수 있습니다. 직원 1은 동의하지 않을 것입니다.

더 나은 측정 기준은 보다 중립적인 측정값으로 간주되는 평균 급여이며 월 6,000.00 USD입니다.

따라서 다음 번에 면접을 볼 때 HR 담당자가 "예, 우리 직원들은 한 달에 X USD 정도를 받습니다"라고 말하면 평균인지 중앙값인지 물어봐야 합니다. 😁

놀랍도록 우아하지만 끔찍한 메트릭은 코드베이스의 코드 라인입니다. 모든 사람이 이해할 수 있는 숫자이고 한 프로젝트에는 100.000 LoC가 있고 다른 프로젝트에는 20.000 LoC가 있으므로 전자가 후자보다 큽니다.

그러나 관리자가 종종 개발자 생산성을 측정하는 데 사용하기 때문에 이는 끔찍한 지표입니다.

왜 그런 겁니까? 글쎄요, 프로그램은 무한한 양의 방법으로 작성될 수 있습니다. 한 개발자는 5줄로 함수를 작성할 수 있고 다른 개발자는 25줄로 작성할 수 있습니다. 어떤게 더 좋아?

또한 코드를 작성하는 과정은 이 블로그 게시물을 작성한다고 가정해 봅시다. 개발자는 1000줄의 코드를 작성하고 300줄을 삭제하고 나머지는 500 LoC 미만으로 수정할 수 있습니다.

또는 한 프로젝트가 한 유형의 코딩 스타일을 다른 유형에 고수할 수 있습니다. 예를 들어 동일한 코드를 네 가지 다른 방법으로 작성할 수 있습니다.

10줄:

console.log(1);
console.log(2);
console.log(3);
console.log(4);
console.log(5);
console.log(6);
console.log(7);
console.log(8);
console.log(9);
console.log(10);


세 줄:

for ( let i = 0; i < 10; i++ ) {
  console.log(i);
}


네 줄:

for ( let i = 0; i < 10; i++ ) 
{
  console.log(i);
}


한 줄:

for ( let i = 0; i < 10; i++ ) { console.log(i); }


코드 라인을 포괄적인 통계로 사용하여 생산성을 측정하는 것은 끔찍하지만 관리자가 이 메트릭을 사용하는 경우 논리적으로 10줄로 작성한 개발자가 가장 생산적입니다.

개발자 생산성은 매우 복잡한 메트릭이며 단일 진실은 없지만 다음과 같은 다양한 다른 전략을 사용할 수 있습니다.
  • 기능이 구현된 후 QA에서 발견한 버그 수입니다.
  • 기능 노력 대 개발 시간.
  • 피어 리뷰의 시간과 노력.

  • 결국 WTF/분은 LoC보다 더 나은 메트릭입니다. 🙃




    사진 표지

    이 문서는 원래 https://primalskill.blog/3-tales-of-tricky-statistics에 게시되었습니다.


    댓글을 달고 이 기사를 공유하는 것을 고려하십시오. 질문이 있으시면 여기 댓글이나 에서 저에게 연락하실 수 있습니다.

    좋은 웹페이지 즐겨찾기