×
Loading ...

Como utilizar o fator de inflação da variância em amostras de tamanho grande

O fator de inflação de variância é uma medida de colinearidade na regressão múltipla. A regressão múltipla é uma técnica estatística para examinar a relação entre uma variável dependente quantitativa e mais que uma variável independente. A colinearidade ocorre quando as variáveis independentes estão fortemente relacionadas umas com as outras. Por exemplo, se houvesse interesse na relação entre várias dimensões corporais (como comprimento da perna, do braço, largura do obro e assim por diante) e massa corporal, provavelmente haveria colinearidade entre as variáveis independentes. O tamanho da amostra não é relevante à computação dos fatores de inflação da variância e há um fator para cada variável independente.

Instruções

  1. Compute os fatores de inflação da variância para a regressão. No SAS, é possível fazer isso na opção "VIF" na homologação MODEL em PROC REG. No R, você pode fazer isso com a função vif no pacote car, que está disponível a partir do CRAN. Se o seu pacote estatístico não computar VIF, ele pode ser computado como 1/(1 - R(k)^2), onde o valor R(k)^2 é o R^2 da regressão da variável independentes kth em outras variáveis independentes.

    Loading...
  2. Avalie a extensão da colinearidade. O VIF para a variável k é uma medida de quanta variância do coeficiente dessa variável está inflado na regressão original. Os VIFs acima de 4 são possivelmente problemáticos e os acima de 10 são definitivamente problemáticos.

  3. Encontre a fonte de colinearidade, se ela existir. Uma maneira de se fazer isso é olhando as correlações da variável problemática com as outras variáveis independentes e ver qual é mais alta.

  4. Decida o que fazer com a colinearidade. Opções incluem a remoção de variáveis, usando a regressão parcial dos quadrados mínimos ou a de cadeia. A escolha dependerá das circunstâncias. Se uma variável não é a chave para a sua investigação, removê-la pode ser bom. Se as variáveis não possuem significado substancial, então a regressão parcial dos quadrados mínimos é uma boa escolha. Se todas as variáveis forem importantes, então a regressão em cadeia é a melhor opção.

Loading...

Aviso

  • Belsley sugere que o uso de índices condicionais fornece mais informações e um melhor diagnóstico que os fatores de inflação de variância.

O que você precisa

  • Computados com software estatístico, como SAS, R, SPSS ou Stata

Referências

Loading ...
Loading ...