평균 편차를 최소화하는 것은 평균값이 아니라 중앙값

1797 단어 통계
다음 평균 편차 $\mu$를 최소화하는 $m$의 조건을 조사합니다.
계산은 초등 물리 수학 수준입니다.
$$
\mu=\frac{1}{n}\sum_i\big|x_i-m\big|
$$

정책



방법으로는
$$\frac{\partial\mu}{\partial m}=0$$
되는 $m$의 조건을 탐색하게 됩니다.
그 전에 다음과 같은 준비를 해 둡니다.

헤비사이드 스텝



절대치가 들어가면 표현하는데 사용할 수 있습니다. 정의는 실수 $x$에 대해 헤비사이드 단계는
\begin{align}
H(x)=
\quad &0 \qquad \text{if} \quad x\leq 0 \\
&1 \qquad \text{if} \quad 0\leq x
\end{align}

에 정의됩니다. 이것을 사용하면 예를 들어
$$|x|=xH(x)-xH(-x)$$
와 같이 다시 작성됩니다.

디락의 델타



델타 함수는
\begin{align}
\delta(x)=
\quad &\infty \qquad \text{if} \quad x=0 \\
&0 \qquad \text{other} \quad x \neq 0
\end{align}

처럼 행동합니다 (정의가 아님).
알려진 성격으로
$$
x\delta(x)=0,\quad\frac{H(x)}{dx}=\delta(x)
$$
가 있습니다 (이번 계산에 사용합니다).

계산으로 돌아가기



상수 $n$를 포함하여 $n\frac{d\mu}{m}$를 계산합니다. 그러면
$$n\frac{d\mu}{dm}
=\sum_i\bigg(
H(m-x_i)-H(x_i-m)
\bigg)
$$
됩니다. 오른쪽은
($m-x_i\geq 0$를 본다 $x_i$의 개수)에서 ($x_i-m\geq 0$를 본다 $x_i$의 개수)를 뺀 것이 됩니다. 이것이 0이 되기 위해서는, 각각의 개수가 동일해지는 것, 즉 $m$가 $x_i$의 중앙값이면 좋은 것을 알 수 있습니다. ■

이건 무슨 이야기인가 하면…



예를 들면 여기 로 하고 있는 계산에 대해서, 유한 개 버젼을 만든 것 같습니다.

뱀발



이번에 iPadOS의 퍼블릭 베타가 나왔다는 것을 기억해, 도입했는데 매우 경쾌했기 때문에, 동작 환경 테스트를 겸해 이 기사를 쓰고 있습니다. 내용은 goodnote에 남아 있던 메모에서 그렇게 그런 재료를 꺼내 그대로 기사로 해 버렸습니다…

(iPad의 스쿠쇼, 위의 계산에서 접힌 부분은 여기의 손 계산 부분에서 확인할 수 있습니다)

좋은 웹페이지 즐겨찾기