遠廻りして愉しむ統計検定®(2021年 1級 統計応用 社会科学 問3[1])
この記事では、2021年に実施された統計検定1級 統計応用 社会科学の問3[1] を、ヒントを無視して解く。
なお、作問者の意図した解答方法ではない可能性があるため、正答扱いされる保証はない。
問題の概要
与えられた行列が正定値となるための条件を求めさせる問題。
ヒントとして、固有値への着目が言及されている。
詳細は公式の過去問題集を参照。
ヒントを無視した解答
$${ \boldsymbol{v} \ne \boldsymbol{0} }$$ を $${ \boldsymbol{0} }$$ でない任意のベクトルとして、 $${ \boldsymbol{v}^\top \boldsymbol{R} \boldsymbol{v} > 0}$$ が常に成り立つ条件を求める。
その前に、$${ \boldsymbol{1}_n }$$ を長さ $${ n }$$ で成分が全て1のベクトルとすると、$${ \boldsymbol{J} }$$ は以下のように表すことに着目する:
$$
\boldsymbol{J} = \boldsymbol{1}_n \boldsymbol{1}_n^\top.
$$
すると、以下の式が成り立つ:
$$
\begin{aligned}
\boldsymbol{v}^\top \boldsymbol{R} \boldsymbol{v} &= (1-\rho) \boldsymbol{v}^\top \boldsymbol{v} + \rho \boldsymbol{v}^\top \boldsymbol{1}_n \boldsymbol{1}_n^\top \boldsymbol{v}\\
&= (1- \rho) \sum_{i=1}^n v_i^2 + \rho \left( \sum_{i=1}^n v_i \right)^2.
\end{aligned}
$$
ここで、$${ \bar{v} = \frac{1}{n} \sum_{i=1}^n v_i }$$ と置くと、$${ \sum_{i=1}^n (v_i - \bar{v})^2 = \sum_{i=1}^n v_i^2 - n (\bar{v})^2 }$$ と表すことができることから、これを上記の式に代入することで、
$$
\begin{aligned}
\boldsymbol{v}^\top \boldsymbol{R} \boldsymbol{v} &= (1-\rho) \sum_{i=1}^n (v_i - \bar{v})^2 + n \left\{ 1 + (n-1)\rho\right\} \bar{v}^2
\end{aligned}
$$
のように書き換えることができる。
$${ \boldsymbol{v} \ne \boldsymbol{0} }$$ は任意より、$${ \sum_{i=1}^n (v_i - \bar{v})^2 }$$ と $${ \bar{v}^2 }$$ を独立な0以上の変数(ただし、同時に0はならない)として扱うことができる。
したがって、$${ 1-\rho > 0 }$$ かつ $${ 1 + (n-1)\rho > 0 }$$ であれば $${ \boldsymbol{v}^\top \boldsymbol{R} \boldsymbol{v} > 0 }$$ が常に成り立つ。
以上から、$${ \boldsymbol{R} }$$ が正定値を取るための $${ \rho }$$ の条件は、
$$
-\frac{1}{n-1} < \rho < 1
$$
である。
補足
全成分が1の行列が、全成分が1のベクトル $${ \boldsymbol{1}_n }$$ の積 $${ \boldsymbol{1}_n \boldsymbol{1}_n^\top }$$ で表せることに着目した:
$$
\begin{aligned}
\boldsymbol{1}_n \boldsymbol{1}_n^\top&=
\begin{pmatrix}
1\\
1\\
\vdots\\
1\\
\end{pmatrix}
\begin{pmatrix}
1 & 1 & \cdots & 1
\end{pmatrix}\\
&=
\begin{pmatrix}
1 & 1 & \cdots & 1\\
1 & 1 & \cdots & 1\\
\vdots & \vdots & \cdots & \vdots\\
1 & 1 & \cdots & 1
\end{pmatrix}.
\end{aligned}
$$
なお、この形の行列は統計学において度々登場するため、覚えておいて損はない。
例えば、$${ n }$$ 次元ベクトル $${ \boldsymbol{x} }$$ の各成分から平均値を差し引く操作(中心化)は、以下のように表すことができる:
$$
\tilde{\boldsymbol{x}} = \left(\boldsymbol{I}_n - \frac{1}{n} \boldsymbol{1}_n \boldsymbol{1}_n^\top \right)\boldsymbol{x}.
$$
以下、なぜこれで中心化できるかを見てみる。
$${ \boldsymbol{x} }$$ の各成分から平均値 $${ \bar{x} = \frac{1}{n} \sum_{i=1}^n x_{i} }$$ を差し引く操作は以下のように表すことができる:
$$
\tilde{\boldsymbol{x}}=
\begin{pmatrix}
x_{1} - \bar{x}\\
x_{2} - \bar{x}\\
\vdots \\
x_{n} - \bar{x}
\end{pmatrix}
= \boldsymbol{x} - \bar{x} \boldsymbol{1}.
$$
一方で、成分平均 $${ \bar{x} }$$ は以下のように書き表すことができる:
$$
\bar{x} = \frac{1}{n} \sum_{i=1}^n x_{i} = \frac{1}{n} \boldsymbol{1}_n ^\top \boldsymbol{x}.
$$
したがって、
$$
\begin{aligned}
\tilde{\boldsymbol{x}} &= \boldsymbol{x} - \frac{1}{n} \boldsymbol{1}_n \boldsymbol{1}_n^\top \boldsymbol{x}\\
&=\left(\boldsymbol{I}_n - \frac{1}{n} \boldsymbol{1}_n \boldsymbol{1}_n^\top \right) \boldsymbol{x}
\end{aligned}
$$
が成り立つ。
この記事が気に入ったらサポートをしてみませんか?