Thursday 28 March 2019

Cross tabulation command in stata forex


Bem-vindo ao Instituto de Pesquisa e Educação Digital Stata FAQ Como você pode obter tabulação cruzada de 3 vias, 4 vias, 5 ou mais em Stata O comando tabular é ótimo para tabulações cruzadas de 2 vias. Mas como você faz 3-way, 4-way, 5-way of more cross tabulations A resposta é usar o comando table com a opção de conteúdo (freq). Aqui está a forma geral do comando da tabela. Antes de começar, vamos carregar o conjunto de dados e criar uma variável categórica adicional, nível de leitura. Começamos por olhar para todas as tabelas de 1 direção para nossas variáveis ​​categóricas. Em seguida, a tabela de 2 vias. Agora, a tabela de 3 vias. Seguido por uma tabela de 4 vias. Finalmente, uma tabela de 5 vias. As tabelas de 5 direções não são o limite. Você pode adicionar mais níveis. Nós deixamos isso como um exercício para encontrar o número máximo de variáveis ​​permitido. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia. Bem-vindo ao Instituto de Pesquisa e Educação Digital Stata Learning Module Um amostrador estatístico em Stata Version info: O código para esta página foi testado em Stata 12. Este módulo dará uma breve visão geral de alguns testes estatísticos comuns em Stata. Permite usar o arquivo de dados automático que usaremos para nossos exemplos. Vamos fazer um teste t comparando as milhas por galão (mpg) de carros estrangeiros e domésticos. Como você vê na saída acima, os carros domésticos tiveram um mpg significativamente menor (19,8) do que os carros estrangeiros (24,7). Chi-quadrado Compare a classificação de reparação (rep78) dos carros estrangeiros e domésticos. Nós podemos fazer um crosstab de rep78 por estrangeiros. Podemos querer saber se essas variáveis ​​são independentes. Podemos usar a opção chi2 para solicitar um teste de independência do qui-quadrado, bem como o crosstab. O qui-quadrado não é realmente válido quando você tem células vazias. Nesses casos, quando você tem células vazias ou células com poucas frequências, você pode solicitar o teste exato de Fishers com a opção exata. Correlação Podemos usar o comando correlato para obter as correlações entre as variáveis. Vamos ver as correlações entre o preço do peso do mpg e o rep78. (Nós usamos rep78 na correlação, embora não seja contínuo para ilustrar o que acontece quando você usa correlação com variáveis ​​com dados faltantes). Observe que a saída acima disse (obs69). O comando correlate deixa os dados em uma base de lista, o que significa que, se alguma das variáveis ​​estiverem faltando, então toda a observação é omitida na análise de correlação. Podemos usar pwcorr (correlações em pares) se quisermos obter correlações que excluam dados faltantes em uma base em par do em vez de uma base em lista. Usaremos a opção obs para mostrar o número de observações utilizadas para calcular cada correlação. Observe como as correlações que envolvem rep78 têm um N de 69 em comparação com as outras correlações que têm um N de 74. Isso ocorre porque rep78 tem cinco valores faltantes, portanto, ele tinha apenas 69 observações válidas, mas as outras variáveis ​​não tinham dados faltantes para Eles tiveram 74 observações válidas. Regressão Vamos analisar a análise de regressão em Stata. Para este exemplo, vamos soltar os casos em que o rep78 é 1 ou 2 ou está ausente. Agora, vamos prever mpg de preço e peso. Como você vê abaixo, o peso é um preditor significativo de mpg. Mas o preço não é. E se nós queríamos prever mpg do rep78 também. Rep78 é realmente mais uma variável categórica do que uma variável contínua. Para incluí-lo na regressão, devemos converter rep78 em variáveis ​​falsas. Felizmente, o Stata faz variáveis ​​dummy facilmente usando tabulate. A opção gen (rep) diz ao Stata que queremos gerar variáveis ​​dummy de rep78 e queremos que o tronco das variáveis ​​fofas seja rep. Stata criou rep1 (1 se rep78 é 3), rep2 (1 se rep78 é 4) e rep3 (1 se rep78 for 5). Podemos usar o comando tabular para verificar se as variáveis ​​fofas foram criadas corretamente. Agora, podemos incluir rep1 e rep2 como variáveis ​​falsas no modelo de regressão. Análise de variância Se você quisesse fazer uma análise de variância olhando as diferenças em mpg entre os três grupos de reparo, você pode usar o comando oneway para fazer isso. Se você incluir a opção de tabulação, você obtém o mpg médio para os três grupos, o que mostra que o grupo com a melhor classificação de reparo (rep78 de 5) também possui o máximo de mpg (27,3). Se você quiser incluir covariáveis, você precisa usar o comando anova. A opção contínua (preço de peso) diz ao Stata que essas variáveis ​​são covariáveis. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

No comments:

Post a Comment