Teste de Hipóteses
Hipóteses
Damos o nome de hipótese estatística a qualquer conjetura sobre um dado estatístico, como por exemplo a distribuição de uma VA de interesse, um parâmetro desconhecido, ou outro.
A uma conjetura sobre um parâmetro damos o nome de hipótese paramétrica.
Este capítulo centra-se no estudo da confiança que podemos dar a uma hipótese paramétrica.
Normalmente, isto é feito através da confrontação de duas hipóteses paramétricas:
- hipótese nula: que consiste na hipótese principal;
- hipótese alternativa: que consiste na hipótese que é confrontada com a hipótese nula.
Normalmente consideramos 3 tipos de hipóteses alternativas:
- unilateral inferior se , isto é, se todos os valores da hipótese alternativa forem inferiores aos da hipótese nula;
- unilateral superior se , isto é, se todos os valores da hipótese alternativa forem superiores aos da hipótese nula;
- bilateral caso enquadre valores para ambos os lados de .
Um exemplo comum de uma hipótese alternativa bilateral é
Uma hipótese paramétrica diz-se ainda simples se especificar um único valor para o parâmetro em caso, dizendo-se composta caso contrário.
Exemplo
Considere-se que queremos analisar a altura da população portuguesa. Assumimos que a distribuição da altura dos portugueses é normal. Sendo assim, é do nosso interesse saber qual é, por exemplo, o valor esperado da altura de um português. Seja este parâmetro .
Um exemplo de uma hipótese paramétrica é:
A média das alturas dos portugueses é .
Esta hipótese paramétrica é simples pois especifica um só valor para o parâmetro desconhecido. Uma hipótese paramétrica composta seria, por exemplo:
A média das alturas dos portugueses está algures entre e .
Se considerarmos a primeira hipótese apresentada como a hipótese nula - - temos que a hipótese alternativa é bilateral - .
Temos que a hipótese nula :
A média das alturas dos portugueses é no mínimo .
Tem uma hipótese alternativa unilateral inferior: .
Deve agora ser fácil imaginar uma hipótese nula cuja hipótese alternativa seja unilateral superior.
Testar um Hipótese
Testar uma hipótese consiste num processo estatístico que leva à aceitação/rejeição da hipótese nula em prol da alternativa. Esta decisão pode ou não estar correta: o teste permite-nos atribuir um valor de probabilidade a uma certa hipótese, mas nunca nos permite calcular sem margem de dúvida o valor de um parâmetro.
Dizemos que ocorreu um:
- erro de primeira espécie se for verdadeira mas for rejeitada pelo teste. Designamos por como a probabilidade de ocorrer um erro destes;
- erro de segunda espécie se for falsa mas for aceite pelo teste. Designamos por como a probabilidade de ocorrer um erro destes;
Quando fazemos um teste, queremos que a probabilidade de ocorrer um erro seja o menor possível.
É, então, normal colocar um limite superior para a probabilidade de ocorrência de erro de primeira espécie. A este limite dá-se o nome de nível de significância (n.s.) e representa-se por .
Para calcular a probabilidade de erro, definimos uma estatística de teste como uma estatística a utilizar no confronto entre um par de hipóteses sobre o parâmetro .
Esta estatística:
- reflete a discrepância entre o estimador de e o valor conjeturado para o mesmo em ();
- tem distribuição (exata ou aproximada) conhecida, sob a validade de ;
- obtém-se, normalmente, à custa de uma certa VA fulcral, substituindo por na sua expressão.
A partir desta estatística , fica então a faltar definir o conjunto de valores que deverão levar à rejeição de . A estes valores damos o nome de valores críticos e a este conjunto região de rejeição ou rejeição crítica de . Esta região é designada por e é tal que , dependendo também da hipótese alternativa.
A decisão em relação a é então a seguinte, para uma estatística teste :
- rejeição;
- aceitação.
Mais uma vez, relembra-se que aceitação não significa que seja verdadeira: pode ocorrer um erro de primeira ou segunda espécie. Podemos, no entanto, concluir, em caso de aceitação da hipótese nula, que a probabilidade de um erro destes acontecer é inferior ao nível de significância . Desta forma, quanto menor , maior o conjunto de valores rejeitados.
Observamos ainda que, se for uma hipótese nula com alternativa bilateral , averiguar com n.s. equivale a averiguar se o valor proposto por pertence ao intervalo de confiança . Temos então que leva à aceitação de com n.s. e leva à rejeição com esse mesmo n.s.
Procedimentos para Testar uma Hipótese
Para testar uma hipótese seguimos, então, o seguinte procedimento:
- Escolhemos a VA de interesse ;
- Identificamos a situação: qual a distribuição de , o parâmetro em questão, outros parâmetros em causa, etc;
- Especificamos as hipóteses: nula () e alternativa ();
- Escolhemos o nível de significância ;
- Escolhemos a estatística de teste e identificamos a sua distribuição sob a validade de ;
- Obtemos a região de rejeição
- Calculamos o valor observado da estatística e decidimos pela rejeição ou não de com n.s. .
Função Potência
Por vezes, além da probabilidade de rejeição para uma hipótese verdadeira, podemos querer essa probabilidade para uma hipótese falsa. Definimos a função potência de um teste como a probabilidade de rejeição da hipótese nula. Temos que
pelo que
-value
Até agora, temos estudado a decisão sobre uma hipótese para um n.s. fixo. No entanto, podemos seguir o sentido contrário: dado o valor observado de uma estatística, determinar para que níveis de significância é que rejeitamos/aceitamos a hipótese nula. Definimos, então, o p-value como o maior nível de significância que leva à aceitação de . Nomeadamente, se tivermos um teste:
- unilateral inferior, , então ;
- unilateral superior, , então ;
- bilateral, em que tem distribuição simétrica em relação à origem, então
Testes de Hipóteses Paramétricas
Determinação de para conhecido
Neste caso, estamos interessados em determinar a zona de rejeição para uma hipótese paramétrica em relação ao valor esperado de uma VA arbitrária cuja variância já conhecemos.
Consideramos, então, a hipótese nula .
Se , temos então que
Sendo assim, a região de rejeição é exatamente
para uma hipótese alternativa bilateral ;
para uma hipótese alternativa unilateral superior ;
para uma hipótese alternativa unilateral inferior ;
Se não seguir uma distribuição normal, invocamos o TLC para obter que
e portanto podemos obter as mesmas regiões de rejeição indicadas acima, desta vez com nível de significância aproximado.
Determinação de para conhecidos
Esta determinação não é lecionada no programa de 2021/22.
Neste caso, estamos interessados em determinar a zona de rejeição para uma hipótese paramétrica em relação à diferença entre os valores esperados de duas VA arbitrárias e cuja variância já conhecemos.
Consideramos, então, a hipótese nula .
Se (), temos que
Sendo assim, a região de rejeição é exatamente
para uma hipótese alternativa bilateral ;
para uma hipótese alternativa unilateral superior ;
para uma hipótese alternativa unilateral inferior ;
Se não seguir uma distribuição normal, invocamos o TLC para obter que
e portanto podemos obter as mesmas regiões de rejeição indicadas acima, desta vez com nível de significância aproximado.
Determinação de para desconhecido
Neste caso, estamos interessados em determinar a zona de rejeição para uma hipótese paramétrica em relação ao valor esperado de uma VA arbitrária cuja variância não conhecemos.
Consideramos, então, a hipótese nula .
Se , temos que
em que é um estimador para a variância - a variância corrigida.
Sendo assim, a região de rejeição é exatamente
para uma hipótese alternativa bilateral ;
para uma hipótese alternativa unilateral superior ;
para uma hipótese alternativa unilateral inferior ;
Se não seguir uma distribuição normal, invocamos o TLC para obter que
e portanto podemos obter as mesmas regiões de rejeição indicadas acima, desta vez com nível de significância aproximado.
Determinação de para desconhecidos
Esta determinação não é lecionada no programa de 2021/22.
Neste caso, estamos interessados em determinar a zona de rejeição para uma hipótese paramétrica em relação à diferença entre os valores esperados de duas VA arbitrárias e cuja variância não conhecemos.
Consideramos, então, a hipótese nula .
Se (), temos que
em que é um estimador para a variância - a variância corrigida.
Sendo assim, a região de rejeição é exatamente
para uma hipótese alternativa bilateral ;
para uma hipótese alternativa unilateral superior ;
para uma hipótese alternativa unilateral inferior ;
Se e não seguirem uma distribuição normal, invocamos o TLC para obter que
e portanto podemos obter as mesmas regiões de rejeição indicadas acima, desta vez com nível de significância aproximado.
Determinação de para desconhecido
Neste caso, estamos interessados em determinar a zona de rejeição para uma hipótese paramétrica em relação à variância de uma VA com distribuição normal cujo valor esperado não conhecemos.
Consideramos, então, a hipótese nula .
Como , temos que
Sendo assim, a região de rejeição é exatamente
para uma hipótese alternativa bilateral ;
para uma hipótese alternativa unilateral superior ;
para uma hipótese alternativa unilateral inferior ;
Determinação de numa Prova de Bernoulli
Neste caso, estamos interessados em determinar a zona de rejeição para uma hipótese paramétrica em relação ao parâmetro de uma Prova de Bernoulli.
Consideramos, então, a hipótese nula .
Como , temos, segundo o TLC, que para
Sendo assim, a região de rejeição é aproximadamente
para uma hipótese alternativa bilateral ;
para uma hipótese alternativa unilateral superior ;
para uma hipótese alternativa unilateral inferior ;
Exemplos
Exemplo
(Exemplo retirado do Teste 2B de 2017/2018 de PE)
O diâmetro ( , em cm) dos tapetes de rato produzidos por determinada fábrica possui distribuição normal com parâmetros desconhecidos e . A concretização de uma amostra aleatória de dimensão 10 conduziu aos seguintes resultados: e .
Caso queiramos testar as seguintes hipóteses (decidindo com base no valor-p)
Devemos, em primeiro lugar, escolher a nossa estatística de teste: sendo que estamos a testar de uma população normal, com desconhecido, faz sentido escolher:
Devemos, ainda, definir inicialmente a região de rejeição de : tratando-se de um teste unilateral superior (com ), dizemos que a região de rejeição de é dada por .
Note-se que, para a amostra considerada, tem-se:
O valor observado, tendo em conta a estatística de teste, é dado por:
Sendo a região de rejeição um intervalo à direita, vamos ter:
Ora, não existe tabela que nos possibilite encontrar o valor específico de . Conseguimos, contudo, enquadrar o valor-p, tal que:
Podemos, assim, recorrendo ao valor-p, afirmar que devemos rejeitar a qualquer nível de significância superior a , e não devemos rejeitar a qualquer nível de significância igual ou inferior a .