Como estimar a diferença entre duas proporções

Video: Como calcular variação % no Excel

Para estimar a diferença entre duas proporções populacionais com um intervalo de confiança, você pode usar o Teorema do Limite Central quando os tamanhos de amostra são grandes o suficiente (tipicamente, cada um, pelo menos 30). Quando uma característica estatística, tais como a opinião sobre uma questão (apoio / não suportam), um dos dois grupos que estão sendo comparados é categórico, as pessoas querem informar sobre as diferenças entre as duas proporções de população - por exemplo, a diferença entre a proporção de mulheres e homens que apoiam uma semana de trabalho de quatro dias. Como você faz isso?

Você estimar a diferença entre duas proporções populacionais, p1 - p2, tomando uma amostra a partir de cada população e utilizando a diferença das duas proporções de amostra,

Video: PENSI - Matematica - Razão e Proporção

mais ou menos uma margem de erro. O resultado é chamado de intervalo de confiança para a diferença de duas proporções populacionais, p1 - p2.

A fórmula para um intervalo de confiança (IC) para a diferença entre duas proporções da população é

e n1 são o tamanho proporção da amostra e da amostra da primeira amostra, e

e n2 são a proporção da amostra e o tamanho da amostra da segunda amostra. O valor que z * é o valor apropriado a partir da distribuição normal padrão para o seu nível de confiança desejado. (Consultar a tabela a seguir para z *-valores.)

z*-Os valores para os vários níveis de confiança
Nível de confiançaz * -valor
80%1,28
90%1,645 (por convenção)
95%1,96
98%2,33
99%2,58

Para calcular uma CI para a diferença entre duas proporções populacionais, faça o seguinte:

  1. Determinar o nível de confiança e encontrar a adequada z *-valor.

    Video: Questão 1: Razão e Proporção

    Referir-se a tabela acima.

  2. Encontrar a proporção da amostra

    Video: IC diferença de duas proporções populacionais

    para a primeira amostra, tendo o número total a partir da primeira amostra que estão na categoria de interesse e dividindo-se pelo tamanho da amostra, n1. Da mesma forma, encontrar

    para a segunda amostra.

  3. Levar a diferença entre as proporções de amostra,

  4. Encontrar

    e dividir por n1. Encontrar

    e dividir por n2. Adicione estes dois resultados juntos e tirar a raiz quadrada.

  5. Multiplicar z * vezes o resultado do Passo 4.

    Este passo dá-lhe a margem de erro.



  6. Levar

    mais ou menos a margem de erro a partir do Passo 5, para obter o CI.

    A extremidade inferior do IC é

    menos a margem de erro, e a extremidade superior do IC é

    acrescido da margem de erro.

A fórmula apresentada aqui para um IC para p1 - p2 é usada sob a condição de que ambos os tamanhos de amostra são grandes o suficiente para o Teorema do Limite Central para ser aplicado e permitem que você use um z* -value- isso é verdade quando você está estimando proporções utilizando inquéritos de grande escala, por exemplo. Para amostras de pequenas dimensões, intervalos de confiança estão fora do âmbito de um curso de estatísticas Introdução.

Suponha que você trabalha para o Las Vegas Câmara de Comércio, e que pretende estimar com 95% de confiança da diferença entre a porcentagem de todas as mulheres que já passaram para ver um imitador de Elvis ea percentagem de todos os homens que já passaram para ver um Elvis imitador, a fim de ajudar a determinar como você deve comercializar suas ofertas de entretenimento.

  1. Porque você quer um intervalo de confiança de 95%, o seu z *-valor é 1.96.

  2. Suponha que a sua amostra aleatória de 100 mulheres inclui 53 mulheres que viram um imitador de Elvis, por isso,

    53 é dividido por 100 = 0,53. Suponha também que a sua amostra aleatória de 110 homens inclui 37 homens que já vi um imitador de Elvis, por isso,

    37 é dividido por 110 = 0,34.

  3. A diferença entre estas proporções de amostra (fêmeas - machos) é 0,53-0,34 = 0,19.

  4. Tome 0,53 * (1 - 0,53) para se obter 0,2941. Em seguida, dividir por 100 para obter 0,0025. Em seguida, tomar 0,34 * (1-0,34) para obter 0,2244. Em seguida, dividir por 110 para obter 0,0020. Adicione estes dois resultados para obter 0,0025 + 0,0020 = 0,0045. Em seguida, encontrar a raiz quadrada de 0,0045, que é 0,0671.

  5. 1,96 * 0,0671 dá-lhe 0,13, ou 13%, que é a margem de erro.

  6. O seu intervalo de confiança de 95% para a diferença entre a percentagem de mulheres que têm visto um imitador de Elvis e a percentagem de homens que têm visto um imitador de Elvis é de 0,19 ou 19% (o que você tem na Etapa 3), mais ou menos 13%. A extremidade inferior do intervalo é de 0,19 - 0,13 = 0,06 ou 6% - a extremidade superior é de 0,19 + 0,13 = 0,32 ou 32%.

    Para interpretar esses resultados dentro do contexto do problema, você pode dizer com 95% de confiança de que um percentual maior de mulheres do que homens têm visto um imitador de Elvis, e a diferença de estas percentagens está em algum lugar entre 6% e 32%, com base no seu amostra.

    A tentação é dizer: “Bem, eu sabia que uma proporção maior de mulheres tem visto um imitador de Elvis porque essa proporção da amostra foi de 0,53 e para os homens foi apenas 0,34. Por que eu ainda preciso de um intervalo de confiança?”Todos esses dois números lhe dizer algo sobre essas 210 pessoas amostradas. Você também precisa levar em consideração a variação usando a margem de erro para ser capaz de dizer algo sobre toda a população de homens e mulheres.

Claro, há alguns caras lá fora, que não admitem que já tinha visto um imitador de Elvis (embora eles provavelmente fingiu ser um fazendo karaoke em algum ponto). Isso pode criar algum viés nos resultados.

Observe que você pode obter um valor negativo para

Por exemplo, se você tinha mudado os machos e fêmeas, você teria chegado -0.19 para esta diferença. Tudo bem, mas você pode evitar diferenças negativas nas proporções de amostras por ter o grupo com a maior proporção de amostra servir como o primeiro grupo (aqui, do sexo feminino).

No entanto, mesmo se o grupo com a maior proporção de amostra serve como o primeiro grupo, às vezes você ainda obter valores negativos no intervalo de confiança. Suponha que no exemplo acima que apenas 0,43 das mulheres tinha visto um imitador de Elvis. Assim, a diferença na proporção é de 0,09, e a extremidade superior do intervalo de confiança é de 0,09 + 0,13 = 0,22, enquanto a extremidade inferior é 0,09-0,13 = -0,04. Isto significa que a verdadeira diferença é razoavelmente em qualquer lugar de 22% mais mulheres a 4% mais homens. É muito perto de dizer com certeza.


Publicações relacionadas