遠廻りして愉しむ統計検定®(2021年 1級 統計応用 社会科学 問3[1])

この記事では、2021年に実施された統計検定1級 統計応用 社会科学の問3[1] を、ヒントを無視して解く。

なお、作問者の意図した解答方法ではない可能性があるため、正答扱いされる保証はない。

問題の概要

与えられた行列が正定値となるための条件を求めさせる問題。
ヒントとして、固有値への着目が言及されている。

詳細は公式の過去問題集を参照。

ヒントを無視した解答

$${ \boldsymbol{v} \ne \boldsymbol{0} }$$ を $${ \boldsymbol{0} }$$ でない任意のベクトルとして、 $${ \boldsymbol{v}^\top \boldsymbol{R} \boldsymbol{v} > 0}$$ が常に成り立つ条件を求める。

その前に、$${ \boldsymbol{1}_n }$$ を長さ $${ n }$$ で成分が全て1のベクトルとすると、$${ \boldsymbol{J} }$$ は以下のように表すことに着目する:

$$
\boldsymbol{J} = \boldsymbol{1}_n \boldsymbol{1}_n^\top.
$$

すると、以下の式が成り立つ:

$$
\begin{aligned}
\boldsymbol{v}^\top \boldsymbol{R} \boldsymbol{v} &= (1-\rho) \boldsymbol{v}^\top \boldsymbol{v} + \rho \boldsymbol{v}^\top \boldsymbol{1}_n \boldsymbol{1}_n^\top \boldsymbol{v}\\
&= (1- \rho) \sum_{i=1}^n v_i^2 + \rho \left( \sum_{i=1}^n v_i \right)^2.
\end{aligned}
$$

ここで、$${ \bar{v} = \frac{1}{n} \sum_{i=1}^n v_i }$$ と置くと、$${ \sum_{i=1}^n (v_i - \bar{v})^2 = \sum_{i=1}^n v_i^2 - n (\bar{v})^2 }$$ と表すことができることから、これを上記の式に代入することで、

$$
\begin{aligned}
\boldsymbol{v}^\top \boldsymbol{R} \boldsymbol{v} &= (1-\rho) \sum_{i=1}^n (v_i - \bar{v})^2 + n \left\{ 1 + (n-1)\rho\right\} \bar{v}^2
\end{aligned}
$$

のように書き換えることができる。

$${ \boldsymbol{v} \ne \boldsymbol{0} }$$ は任意より、$${ \sum_{i=1}^n (v_i - \bar{v})^2 }$$ と $${ \bar{v}^2 }$$ を独立な0以上の変数(ただし、同時に0はならない)として扱うことができる。

したがって、$${ 1-\rho > 0 }$$ かつ $${ 1 + (n-1)\rho > 0 }$$ であれば $${ \boldsymbol{v}^\top \boldsymbol{R} \boldsymbol{v} > 0 }$$ が常に成り立つ。

以上から、$${ \boldsymbol{R} }$$ が正定値を取るための $${ \rho }$$ の条件は、

$$
-\frac{1}{n-1} < \rho < 1
$$

である。

補足

全成分が1の行列が、全成分が1のベクトル $${ \boldsymbol{1}_n }$$ の積 $${ \boldsymbol{1}_n \boldsymbol{1}_n^\top }$$ で表せることに着目した:

$$
\begin{aligned}
\boldsymbol{1}_n \boldsymbol{1}_n^\top&=
\begin{pmatrix}
1\\
1\\
\vdots\\
1\\
\end{pmatrix}
\begin{pmatrix}
1 & 1 & \cdots & 1
\end{pmatrix}\\
&=
\begin{pmatrix}
1 & 1 & \cdots & 1\\
1 & 1 & \cdots & 1\\
\vdots & \vdots & \cdots & \vdots\\
1 & 1 & \cdots & 1
\end{pmatrix}.
\end{aligned}
$$

なお、この形の行列は統計学において度々登場するため、覚えておいて損はない。

例えば、$${ n }$$ 次元ベクトル $${ \boldsymbol{x} }$$ の各成分から平均値を差し引く操作(中心化)は、以下のように表すことができる:

$$
\tilde{\boldsymbol{x}} = \left(\boldsymbol{I}_n - \frac{1}{n} \boldsymbol{1}_n \boldsymbol{1}_n^\top \right)\boldsymbol{x}.
$$

以下、なぜこれで中心化できるかを見てみる。

$${ \boldsymbol{x} }$$ の各成分から平均値 $${ \bar{x} = \frac{1}{n} \sum_{i=1}^n x_{i} }$$ を差し引く操作は以下のように表すことができる:

$$
\tilde{\boldsymbol{x}}=
\begin{pmatrix}
x_{1} - \bar{x}\\
x_{2} - \bar{x}\\
\vdots \\
x_{n} - \bar{x}
\end{pmatrix}
= \boldsymbol{x} - \bar{x} \boldsymbol{1}.
$$

一方で、成分平均 $${ \bar{x} }$$ は以下のように書き表すことができる:

$$
\bar{x} = \frac{1}{n} \sum_{i=1}^n x_{i} = \frac{1}{n} \boldsymbol{1}_n ^\top \boldsymbol{x}.
$$

したがって、

$$
\begin{aligned}
\tilde{\boldsymbol{x}} &= \boldsymbol{x} - \frac{1}{n} \boldsymbol{1}_n \boldsymbol{1}_n^\top \boldsymbol{x}\\
&=\left(\boldsymbol{I}_n - \frac{1}{n} \boldsymbol{1}_n \boldsymbol{1}_n^\top \right) \boldsymbol{x}
\end{aligned}
$$

が成り立つ。


この記事が気に入ったらサポートをしてみませんか?