ライントランセクト調査による個体数の区間推定5

さて、$ \hat{w} $、$ n $、$ \bar{s} $の分散をそれぞれ考えてきました。また一番最初の記事で紹介した

Var[D] \cong \left( \frac{n \bar{s}}{2L \hat{w}} \right)^2 \left(\frac{Var[n]}{n^2} + \frac{Var[\hat{w}]}{\hat{w}^2} + \frac{Var[\bar{s}]}{\bar{s}^2} \right)

という式を用いれば、生息数密度Dの分散が求まります。これをもとに、いよいよDの信頼区間について考えていきたいと思います。

 

$ \hat{D} $は通常、対数正規分布に従うと仮定されます。なので、$ \log(\hat{D}) $は正規分布に従います。正規分布に従う確率密度関数の95%信頼区間は、統計の教科書に載っているはずなので省略します。信頼区間は以下のようになります。

\log(\hat{D}) - 1.96\sqrt{Var[\log(\hat{D})]} \leqq \log(D) \leqq \log(\hat{D}) + 1.96\sqrt{Var[\log(\hat{D})]} \tag{1}

となります。

ここで、前回の行った計算と同様にすると、$ \mathcal{N}(μ, σ) $に従う確率変数を$ X $としたとき、$ \exp(X) $の期待値と分散はそれぞれ$ \exp(μ+σ/2), \exp(2μ+σ) \cdot (\exp(σ)-1) $となります。これとここから逆に考えると、期待値$ m $,分散$ v $の対数正規分布に従う確率変数を$ Y $とした時、$ \log(Y) $の期待値と分散はそれぞれ、

 

Var[\log(Y)] = \log \left(\frac{v}{m^2}+1 \right)

となります。2つ目の式より、

Var[\log(D)] = \log \left(\frac{Var[ \hat{D} ]}{\hat{D}^2} + 1\right)

となります。これを(1)式に代入すると、

\log(\hat{D}) - 1.96\sqrt{\log \left(\frac{Var[\hat{D}]}{\hat{D}^2} + 1\right)} \leqq \log(D) \leqq \log(\hat{D}) + 1.96\sqrt{\log \left(\frac{Var[\hat{D}]}{\hat{D}^2} + 1\right)}

となります。$ D $の95%信頼区間を求めるには、各辺にexpをつけてあげればよいだけです。結果は以下のようになります。

\frac{\hat{D}}{C} \leqq D \leqq C\hat{D}

ただし、

C = \exp \left(1.96\sqrt{\log \left(\frac{Var[\hat{D}]}{\hat{D}^2} + 1\right)} \right)

です。

 

以上で説明は終わりですが、ここまでの記事は面倒がっていたせいでかなり適当になっているので、今後時間があるときに修正していこうと思っています。またもし分からない部分、間違いなどありましたら、コメント欄に書いていただければと思います。それではここまでこの記事をお読みいただき、ありがとうございました。

 

ここまでの参考資料

Buckland S.T., Anderson D.R., Burnham K.P., Laake J.L.(1993), Distance Sampling:  Estimating Abundance of Biological Populations, Chapman and Hall, London.