Edit page

Estimação por Intervalos

No capítulo anterior, além de introduzirmos o estudo da estatística, vimos métodos para indicar o valor mais provável para um certo parâmetro. Neste capítulo, em vez de procurarmos formas de indicar o valor exato de um parâmetro, vamos procurar descobrir um intervalo no qual tenhamos um certo grau de confiança que o parâmetro esteja incluído.

Intervalo de Confiança (IC)

Damos o nome de intervalo de confiança a um intervalo [aα,bα][a_\alpha, b_\alpha] tal que, para um parâmetro desconhecido θ\theta, temos que

P(θ<aα)=P(θ>bα)=α2P(aαθbα)=1αP(\theta < a_\alpha) = P(\theta > b_\alpha) = \frac{\alpha}{2} \\ \Rightarrow P(a_\alpha \leq \theta \leq b_\alpha) = 1 - \alpha

O valor 1α1-\alpha designa-se grau de confiança - temos (1α)×100%(1-\alpha) \times 100 \% de confiança que o parâmetro que queremos descobrir está no intervalo dado.

Método da VA fulcral

O método da VA fulcral é um método que permite definir um IC com grau de confiança 1α1-\alpha (exato ou aproximado). Para isto, é primeiro necessário identificar o parâmetro desconhecido θ\theta, a VA de interesse XX, bem como a sua distribuição que pode ou não depender de outros parâmetros (conhecidos ou desconhecidos).

  1. Seleção da VA fulcral - O primeiro passo corresponde à identificação de uma VA (fulcral) Z=Z(X,θ)Z = Z(\underline{X}, \theta), cuja distribuição seja independente de θ\theta. Note-se como esta VA depende da amostra aleatória X\underline{X}. A seleção desta VA fulcral depende da distribuição de XX, do parâmetro que queremos determinar e dos restantes parâmetros da distribuição XX, conhecidos ou não (vamos ver como selecionar esta VA mais à frente);
  2. Obtenção dos quantis - De seguida, temos de determinar aα,bαa_\alpha, b_\alpha tais que P(Z<aα)=P(Z>bα)=α2P(Z < a_\alpha) = P(Z > b_\alpha) = \frac{\alpha}{2}, ou seja
    aα=FZ1(α2)bα=FZ1(1α2)a_\alpha = F_Z^{-1}\left(\frac{\alpha}{2}\right) \quad \quad \quad b_\alpha = F_Z^{-1}\left(1-\frac{\alpha}{2}\right)
  3. Obtenção dos extremos aleatórios - Manuseamos as expressões acima para obter T1(X)T_1(\underline{X}), T2(X)T_2(\underline{X}) tais que P(θT1(X))=P(T2(X)θ)=α2P(\theta \leq T_1(\underline{X})) = P(T_2(\underline{X}) \leq \theta) = \frac{\alpha}{2}
  4. Concretização - Finalmente, substituímos X\underline{X} por x\underline{x} de forma a obter IC(θ)=[T1(x),T2(x)]IC(\theta) = [T_1(\underline{x}), T_2(\underline{x})], com grau de confiança 1α1-\alpha.

Abaixo, vamos ver que VA fulcral usar em diversos cenários. Estas expressões podem ser encontradas no formulário pelo que não é preciso decorá-las, mas é relevante praticar e perceber em que situação se usa cada fórmula.
No fim deste capítulo, encontram-se alguns exemplos para perceber melhor este método.

Determinação de μ\mu para σ2\sigma^2 conhecido

Neste caso, estamos interessados em descobrir o valor do parâmetro μ\mu (valor esperado) de uma VA arbitrária XX cuja variância já conhecemos.

Parâmetro desconhecido: μ\mu
VA de interesse: Uma VA qualquer a que vamos chamar XX
Outros parâmetros: σ2\sigma^2 (conhecido)

Se Xnormal(μ,σ2)X \sim \op{normal}(\mu, \sigma^2), sabemos que

Z=Xμσnnormal(0,1)Z = \frac{\overline{X} - \mu}{\frac{\sigma}{\sqrt{n}}} \sim \op{normal}(0,1)

Aplicando o método da VA fulcral à VA ZZ, obtemos um intervalo de confiança

IC(μ)=[xΦ1(1α2)σn,x+Φ1(1α2)σn]IC(\mu) = \left[ \overline{x} - \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \frac{\sigma}{\sqrt{n}}, \quad \overline{x} + \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \frac{\sigma}{\sqrt{n}} \right]

com grau de confiança exatamente 1α1-\alpha.

Se XX não seguir uma distribuição normal, invocamos o TLC para obter

Z=Xμσnanormal(0,1)Z = \frac{\overline{X} - \mu}{\frac{\sigma}{\sqrt{n}}} \sima \op{normal}(0,1)

e portanto podemos obter um intervalo de confiança

IC(μ)=[xΦ1(1α2)σn,x+Φ1(1α2)σn]IC(\mu) = \left[ \overline{x} - \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \frac{\sigma}{\sqrt{n}}, \quad \overline{x} + \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \frac{\sigma}{\sqrt{n}} \right]

com grau de confiança aproximadamente 1α1-\alpha.

Determinação de μ1μ2\mu_1 - \mu_2 para σ12,σ22\sigma_1^2, \sigma_2^2 conhecidos

Esta determinação não é lecionada no programa de 2021/22.

Neste caso, estamos interessados em descobrir o valor do parâmetro μ1μ2\mu_1 - \mu_2 (diferença entre os valores esperados) para duas VA arbitrárias X1,X2X_1, X_2 independentes entre si (X1 ⁣ ⁣ ⁣X2X_1 \indep X_2) cuja variância já conhecemos.

Parâmetro desconhecido: μ1μ2\mu_1 - \mu_2
VA de interesse: Duas VA quaisquer a que vamos chamar X1,X2X_1, X_2, X1 ⁣ ⁣ ⁣X2X_1 \indep X_2
Outros parâmetros: σ12,σ22\sigma_1^2, \sigma_2^2 (conhecidos)

Se Xinormal(μi,σi2)X_i \sim \op{normal}(\mu_i, \sigma_i^2) (i{1,2}i \in \{1,2\}), temos que

Z=(X1X2)(μ1μ2)σ12n1+σ22n2normal(0,1)Z = \frac{(\overline{X_1} - \overline{X_2}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim \op{normal}(0,1)

Aplicando o método da VA fulcral à VA ZZ, obtemos um intervalo de confiança

IC(μ)=[(x1x2)Φ1(1α2)σ12n1+σ22n2,(x1x2)+Φ1(1α2)σ12n1+σ22n2]IC(\mu) = \left[ (\overline{x_1} - \overline{x_2}) - \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}, \quad (\overline{x_1} - \overline{x_2}) + \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \right]

com grau de confiança exatamente 1α1-\alpha.

Se X1X_1 e X2X_2 não seguirem uma distribuição normal, invocamos o TLC para obter

Z=(X1X2)(μ1μ2)σ12n1+σ22n2anormal(0,1)Z = \frac{(\overline{X_1} - \overline{X_2}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sima \op{normal}(0,1)

e portanto podemos obter um intervalo de confiança

IC(μ)=[(x1x2)Φ1(1α2)σ12n1+σ22n2,(x1x2)+Φ1(1α2)σ12n1+σ22n2]IC(\mu) = \left[ (\overline{x_1} - \overline{x_2}) - \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}, \quad (\overline{x_1} - \overline{x_2}) + \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \right]

com grau de confiança aproximadamente 1α1-\alpha.

Determinação de μ\mu para σ2\sigma^2 desconhecido

Neste caso, estamos interessados em descobrir o valor do parâmetro μ\mu (valor esperado) de uma VA arbitrária XX cuja variância não conhecemos (portanto vamos ter de a estimar também).

Parâmetro desconhecido: μ\mu
VA de interesse: Uma VA qualquer a que vamos chamar XX
Outros parâmetros: σ2\sigma^2 (desconhecido)

Se Xnormal(μ,σ2)X \sim \op{normal}(\mu, \sigma^2), temos que

Z=Xμsnt(n1)Z = \frac{\overline{X} - \mu}{\frac{s}{\sqrt{n}}} \sim t_{(n-1)}

em que ss é um estimador para a variância - a variância corrigida.
Aplicando o método da VA fulcral à VA ZZ, obtemos um intervalo de confiança

IC(μ)=[xFt(n1)1(1α2)sn,x+Ft(n1)1(1α2)sn]IC(\mu) = \left[ \overline{x} - F_{t_{(n-1)}}^{-1}\left(1-\frac{\alpha}{2}\right) \frac{s}{\sqrt{n}}, \quad \overline{x} + F_{t_{(n-1)}}^{-1}\left(1-\frac{\alpha}{2}\right) \frac{s}{\sqrt{n}} \right]

com grau de confiança exatamente 1α1-\alpha.

Se XX não seguir uma distribuição normal, invocamos o TLC para obter

Z=Xμsnanormal(0,1)Z = \frac{\overline{X} - \mu}{\frac{s}{\sqrt{n}}} \sima \op{normal}(0,1)

e portanto podemos obter um intervalo de confiança

IC(μ)=[xΦ1(1α2)sn,x+Φ1(1α2)sn]IC(\mu) = \left[ \overline{x} - \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \frac{s}{\sqrt{n}}, \quad \overline{x} + \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \frac{s}{\sqrt{n}} \right]

com grau de confiança aproximadamente 1α1-\alpha.

Determinação de μ1μ2\mu_1 - \mu_2 para σ12,σ22\sigma_1^2, \sigma_2^2 desconhecidos

Esta determinação não é lecionada no programa de 2021/22.

Neste caso, estamos interessados em descobrir o valor do parâmetro μ1μ2\mu_1 - \mu_2 (diferença entre os valores esperados) para duas VA arbitrárias X1,X2X_1, X_2 independentes entre si (X1 ⁣ ⁣ ⁣X2X_1 \indep X_2) cuja variância não conhecemos.

Parâmetro desconhecido: μ1μ2\mu_1 - \mu_2
VA de interesse: Duas VA quaisquer a que vamos chamar X1,X2X_1, X_2, X1 ⁣ ⁣ ⁣X2X_1 \indep X_2
Outros parâmetros: σ12,σ22\sigma_1^2, \sigma_2^2 (desconhecidos)

Se Xinormal(μi,σi2)X_i \sim \op{normal}(\mu_i, \sigma_i^2) (i{1,2}i \in \{1,2\}), temos que

Z=(X1X2)(μ1μ2)(n11)s12+(n21)s22n1+n22(1n1+1n2)t(n1)Z = \frac{(\overline{X_1} - \overline{X_2}) - (\mu_1 - \mu_2)}{\sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}\left(\frac{1}{n_1} + \frac{1}{n_2} \right)}} \sim t_{(n-1)}

Aplicando o método da VA fulcral à VA ZZ, obtemos um intervalo de confiança

IC(μ)=[(x1x2)Ft(n1+n22)1(1α2)(n11)s12+(n21)s22n1+n22(1n1+1n2),(x1x2)+Ft(n1+n22)1(1α2)(n11)s12+(n21)s22n1+n22(1n1+1n2)]IC(\mu) = \left[ (\overline{x_1} - \overline{x_2}) - F_{t_{(n_1+n_2-2)}}^{-1}\left(1-\frac{\alpha}{2}\right) \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}\left(\frac{1}{n_1} + \frac{1}{n_2} \right)}, \quad (\overline{x_1} - \overline{x_2}) + F_{t_{(n_1+n_2-2)}}^{-1}\left(1-\frac{\alpha}{2}\right) \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}\left(\frac{1}{n_1} + \frac{1}{n_2} \right)} \right]

com grau de confiança exatamente 1α1-\alpha.

Se X1X_1 e X2X_2 não seguirem uma distribuição normal, invocamos o TLC para obter

Z=(X1X2)(μ1μ2)s12n1+s22n2anormal(0,1)Z = \frac{(\overline{X_1} - \overline{X_2}) - (\mu_1 - \mu_2)}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} \sima \op{normal}(0,1)

e portanto podemos obter um intervalo de confiança

IC(μ)=[(x1x2)Φ1(1α2)s12n1+s22n2,(x1x2)+Φ1(1α2)s12n1+s22n2]IC(\mu) = \left[ (\overline{x_1} - \overline{x_2}) - \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}, \quad (\overline{x_1} - \overline{x_2}) + \Phi^{-1}\left(1-\frac{\alpha}{2}\right) \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} \right]

com grau de confiança aproximadamente 1α1-\alpha.

Determinação de σ2\sigma^2 para μ\mu desconhecido

Neste caso, estamos interessados em descobrir o valor do parâmetro σ2\sigma^2 (variância) de uma VA XX cujo valor esperado não conhecemos.

Parâmetro desconhecido: σ2\sigma^2
VA de interesse: Uma VA qualquer que vamos chamar XX
Outros parâmetros: μ\mu (desconhecido)

Se Xnormal(μ,σ2)X \sim \op{normal}(\mu, \sigma^2) temos que

Z=(n1)s2σ2χ(n1)2Z = \frac{(n-1)s^2}{\sigma^2} \sim \chi_{(n-1)}^2

Aplicando o método da VA fulcral à VA ZZ, obtemos o intervalo de confiança

IC(σ2)=[(n1)s2Fχ(n1)21(1α2),(n1)s2Fχ(n1)21(α2)]IC(\sigma^2) = \left[ \frac{(n-1)s^2}{F^{-1}_{\chi_{(n-1)}^2} \left(1-\frac{\alpha}{2}\right)}, \quad \frac{(n-1)s^2}{F^{-1}_{\chi_{(n-1)}^2} \left(\frac{\alpha}{2}\right)} \right]

com grau de confiança exatamente 1α1-\alpha.

Determinação de pp numa Prova de Bernoulli

A expressão relativa a este cenário não se encontra no formulário: é preciso decorá-la!

Parâmetro desconhecido: pp
VA de interesse: Uma VA com distribuição de Bernoulli XX

Se XBernoulli(p)X \sim Bernoulli(p), temos, segundo o TLC, que para n>>n>>

XpX(1X)nanormal(0,1)\frac{\overline{X} - p}{\sqrt{\frac{\overline{X}(1-\overline{X})}{n}}} \sima \op{normal}(0,1)

Aplicando o método da VA fulcral à VA ZZ, obtemos o intervalo de confiança

IC(p)=[xΦ1(1α2)x(1x)n,x+Φ1(1α2)x(1x)n]IC(p) = \left[ \overline{x} - \Phi^{-1}\left(1-\frac{\alpha}{2}\right)\sqrt{\frac{\overline{x}(1-\overline{x})}{n}}, \quad \overline{x} + \Phi^{-1}\left(1-\frac{\alpha}{2}\right)\sqrt{\frac{\overline{x}(1-\overline{x})}{n}} \right]

com grau de confiança aproximadamente 1α1-\alpha.

Determinação de λ\lambda numa distribuição de Poisson

Esta determinação não é lecionada no programa de 2021/22.

Parâmetro desconhecido: λ\lambda
VA de interesse: Uma VA com distribuição de Poisson XX

Se XPoisson(λ)X \sim Poisson(\lambda), temos, segundo o TLC, que para n>>n>>

XλXnanormal(0,1)\frac{\overline{X} - \lambda}{\sqrt{\frac{\overline{X}}{n}}} \sima \op{normal}(0,1)

Aplicando o método da VA fulcral à VA ZZ, obtemos o intervalo de confiança

IC(p)=[xΦ1(1α2)xn,x+Φ1(1α2)xn]IC(p) = \left[ \overline{x} - \Phi^{-1}\left(1-\frac{\alpha}{2}\right)\sqrt{\frac{\overline{x}}{n}}, \quad \overline{x} + \Phi^{-1}\left(1-\frac{\alpha}{2}\right)\sqrt{\frac{\overline{x}}{n}} \right]

com grau de confiança aproximadamente 1α1-\alpha.

Notas e Exemplos

Nota

Observe-se que só é possível obter intervalos de confiança exatos para VA's com distribuições normais. Num exercício é importante perceber se procuramos o IC exato ou aproximado para determinar a VA fulcral a usar.

Exemplo 1

(Exemplo retirado do Teste 2C de 2016/2017 de PE)

A quantidade de minutos (XX , em centenas de minutos) de um jogador two-way na NBA possui distribuição normal, sendo os respetivos valor esperado e variância desconhecidos. Sabendo que a concretização (x1,...,xn)(x_1, ..., x_n) de uma amostra proveniente da população XX conduziu a i=110xi=293\sum_{i=1}^{10} x_i = 293 e i=110xi2=8745\sum_{i=1}^{10} x_i^2 = 8745.

Caso queiramos construir um intervalo de confiança a 90%90\% para o desvio padrão de um jogador do tipo referido, devemos:

  1. Selecionar a VA Fulcral

μ\mu e σ2\sigma^2 são desconhecidos. Querendo um intervalo de confiança para σ\sigma, faz sentido escolher a VA:

Z=(n1)S2σ2χ(n1)2Z = \frac{(n-1)S^2}{\sigma^2} \sim \chi_{(n-1)}^2
  1. Obter os quantis de probabilidade

Temos que n=10n=10 e (1α)=0.9(1 - \alpha) = 0.9, pelo que:

(aα,bα):{P(aαZbα)=1αP(Z<aα)=P(Z>bα)=α2{aα=Fχ(n1)21(α2)=Fχ(n1)21(0.05)=tabela3.325bα=Fχ(n1)21(1α2)=Fχ(n1)21(0.95)=tabela16.92\begin{aligned} (a_\alpha, b_\alpha): &\begin{cases} P(a_\alpha \leq Z \leq b_\alpha) = 1 - \alpha \\ P(Z < a_\alpha) = P(Z > b_\alpha) = \frac{\alpha}{2} \end{cases}\\ &\begin{cases} a_\alpha = F_{\chi_{(n-1)}^2}^{-1} (\frac{\alpha}{2}) = F^{-1}_{\chi_{(n-1)}^2} (0.05) \overset{\text{tabela}}{=} 3.325 \\ b_\alpha = F_{\chi_{(n-1)}^2}^{-1} (1 - \frac{\alpha}{2}) = F^{-1}_{\chi_{(n-1)}^2} (0.95) \overset{\text{tabela}}{=} 16.92 \end{cases} \end{aligned}
  1. Inverter a desigualdade aαZbαa_\alpha \leq Z \leq b_\alpha
P(aαZbα)=1αP[aα(n1)S2σ2bα]=1αP[1bασ2(n1)S21aα]=1αP[(n1)S2bασ2(n1)S2aα]=1αP[(n1)S2bασ(n1)S2aα]=1α\begin{aligned} & P(a_\alpha \leq Z \leq b_\alpha) = 1 - \alpha \\ & P\biggl[a_\alpha \leq \frac{(n-1)S^2}{\sigma^2} \leq b_\alpha \biggr] = 1 - \alpha \\ & P\biggl[\frac{1}{b_\alpha} \leq \frac{\sigma^2}{(n-1)S^2} \leq \frac{1}{a_\alpha} \biggr] = 1 - \alpha \\ & P\biggl[\frac{(n-1)S^2}{b_\alpha} \leq \sigma^2 \leq \frac{(n-1)S^2}{a_\alpha} \biggr] = 1 - \alpha \\ & P\biggl[\sqrt{\frac{(n-1)S^2}{b_\alpha}} \leq \sigma \leq \sqrt{\frac{(n-1)S^2}{a_\alpha}} \biggr] = 1 - \alpha \\ \end{aligned}
  1. Concretizar

Vamos ter, para os dados do enunciado, que:

s2=1n1[i=1nxi2n(x)2]=1101(87451029.32)=17.7(8)\begin{aligned} s^2 &= \frac{1}{n - 1}\biggl[\sum_{i=1}^{n}{x_i}^2 - n (\overline{x})^2 \biggr] \\ &= \frac{1}{10 - 1}(8745 - 10 \cdot 29.3^2) \\ &= 17.7(8) \end{aligned}

Fazendo as devidas substituições, vamos ter um intervalo de confiança para o desvio padrão tal que:

IC90%(σ)=[(n1)S2bα,(n1)S2aα]=[(101)17.7(8)16.92,(101)17.7(8)3.325]=[3.0762,6.9389]\begin{aligned} IC_{90\%}(\sigma) &= \biggl[\sqrt{\frac{(n-1)S^2}{b_\alpha}}, \sqrt{\frac{(n-1)S^2}{a_\alpha}} \biggr] \\ &= \biggl[\sqrt{\frac{(10 - 1)\cdot 17.7(8)}{16.92}}, \sqrt{\frac{(10 - 1)\cdot 17.7(8)}{3.325}} \biggr] \\ &= [3.0762, 6.9389] \\ \end{aligned}
Exemplo 2

A quantidade de açúcar (em grama) na calda de pêssegos em lata tem distribuição normal. É extraída uma amostra de n=10n = 10 latas que resulta num desvio padrão amostral s=4.8s = 4.8. Determine o intervalo de confiança a 95% para a variância populacional, σ2\sigma^{2}.


Queremos calcular IC0.95(σ2)IC_{0.95}(\sigma^{2}) com μ\mu desconhecido.

  • V.A de interesse:

    XN(μ,σ2)X \sim N(\mu, \sigma^{2})

    com μ\mu e σ\sigma desconhecidos.

  • V.A fulcral:

    T=(n1)S2σ2=9S2σ2χ92T = \frac{(n - 1)S^{2}}{\sigma^{2}} = \frac{9S^{2}}{\sigma^{2}} \sim \chi_{9}^{2}
  • Quantis:

    a=Fχ(9)21(0.025)=2.70b=Fχ(9)21(0.975)=19.02a = F_{\chi_{(9)}^{2}}^{-1}(0.025) = 2.70 \\ b = F_{\chi_{(9)}^{2}}^{-1}(0.975) = 19.02
  • Cálculo de ICA:

    P(a<T<b)P(a < T < b)
    a<(n1)S2σ2<ba < \frac{(n-1)S^{2}}{\sigma^{2}} < b
    a9S2<1σ2<b9S2\frac{a}{9S^{2}} < \frac{1}{\sigma^{2}} < \frac{b}{9S^{2}}
    9S2a>σ2>9S2b\frac{9S^{2}}{a} > \sigma^{2} > \frac{9S^2}{b}
    ICA0.95(σ2)=[9S2b,9S2a]ICA_{0.95}(\sigma^{2}) = \left[\frac{9S^{2}}{b}, \frac{9S^2}{a}\right]
  • Cálculo de IC: Substituindo pelos valores obtemos o intervalo de confiança 95%

    IC0.95(σ2)=[9×4.8219.02,9×4.822.07]=[10.90,76.8]IC_{0.95}(\sigma^{2}) = \left[\frac{9 \times 4.8^2}{19.02}, \frac{9 \times 4.8^2} {2.07}\right] = \left[10.90, 76.8\right]