Coluna da Sandra Brignol

segunda-feira, 2 de setembro de 20130 comentários

Olá a todos e todas interessados em aprender um pouco do programa Data Analysis and Statistical Software (stata.com) ou simplesmente STATA!
Hoje vamos iniciar falando um pouco do banco de dados a ser analisado. Quando se compra o STATA e faz a instalação, acompanha um programa chamado StataTransfer. Ele serve para converter arquivos gerados em outros programas para o formato STATA. A versão mais atual do STATA é a 13, mas nós estaremos utilizando a versão 10, que tenho acesso.

Os arquivos de dados do STATA tem a extensão “dta” e é identificado pelo Windows Explorer como “Stata Dataset”. Você pode usar o “StataTransfer” para converter arquivos do SAS, SPSS, Excel, entre outros formatos para o STATA. Mas para pequenos bancos de dados em Excel funciona o copiar e colar: Você seleciona toda a área de dados (Colunas e Linhas) da planilha Excel e cola na área de dados do STATA. Em geral funciona bem, mas cuidado com o separador de decimal (tem que ser ponto para o STATA ler os valores como números) e as datas muitas vezes são lidas como valores “não numéricos ou alfanuméricos – não dá para fazer cálculos”.

Escolhi um conjunto de dados bem atual sobre o número de homicídios entre jovens no Estado da Bahia. O documento com os resultados da pesquisa nacional e os bancos de dados completos estão disponíveis no site: mapadaviolencia.org.br

Para maiores detalhes da pesquisa, dados e definição das variáveis sugiro ler o relatório disponível no link acima.
Abaixo a descrição das variáveis que estaremos analisando:


Link para baixar o banco de dados em formato STATA: homicidios_BA.dta 
1. Abra o STATA
2. No menu File/open – localize e abra o arquivo de dados homicidios_BA.dta 

Observações: Janela do programa a esquerda e a janela que mostra o banco de dados a direita (para acionar esta janela clique no botão indicado). Lembrando que no STATA enquanto esta janela de dados estiver aberta não é possível executar outros comandos.





Elementos da janela:
1. Dentro do circulo vermelho o STATA disponibiliza as informações das variáveis do banco.
2. A área em preto é onde aparecerão os resultados das análises e a área mais inferior (COMMAND) é onde devemos digitar os comandos. 
3. No menu STATISTICS é possível acessar muitas funcionalidades do STATA sem precisar digitar  os comandos. Mas nós inicialmente vamos usar alguns comandos que são muito úteis.

Primeiros comandos:
1. Clique no quadro inferior da janela (Command) e digite o comando abaixo e tecle < enter>:
sum  nhom09

Resultado do comando: Nome da variável, número de observações, desvio padrão, valor máximo e mínimo.

Variable Obs       Mean            Std. Dev.         Min Max
nhom09 417       5.681055     49.35621       0         977

2. Clique no quadro inferior da janela (Command), digite o comando abaixo e tecle < enter>:

sum  nhom09 nhom10 nhom11

Resultado do comando: Agora temos um resumo das três variáveis que informam o número de homicídios nos anos de 2009, 2010 e 2011.

Variable Obs Mean Std. Dev. Min Max
nhom09 417 5.681055 49.35621 0 977
nhom10 417 5.772182 46.67078 0 907
nhom11 417 5.268585 39.85792 0 777

3. Clique no quadro inferior da janela (Command), digite o comando abaixo e tecle < enter>:

sum  nhom09 nhom10 nhom11, detail

Resultado do comando: Este comando permite visualizar outras estatísticas importantes para conhecer a distribuição das variáveis de interesse:

nHom09
Percentiles Smallest
1% 0 0
5% 0 0
10% 0 0 Obs 417
25% 0 0 Sum of Wgt. 417
50% 0 Mean 5.681055
Largest Std. Dev. 49.35621
75% 2 98
90% 5 104 Variance 2436.035
95% 11 126 Skewness 18.44495
99% 79 977 Kurtosis 361.6289

nHom10
Percentiles Smallest
1% 0 0
5% 0 0
10% 0 0 Obs 417
25% 0 0 Sum of Wgt. 417
50% 0 Mean 5.772182
Largest Std. Dev. 46.67078
75% 1 115
90% 5 119 Variance 2178.162
95% 12 161 Skewness 17.54082
99% 102 907 Kurtosis 335.6003

nHom11
Percentiles Smallest
1% 0 0
5% 0 0
10% 0 0 Obs 417
25% 0 0 Sum of Wgt. 417
50% 0 Mean 5.268585
Largest Std. Dev. 39.85792
75% 2 86
90% 5 94 Variance 1588.654
95% 13 126 Skewness 17.64549
99% 84 777 Kurtosis 339.0607



O que você aprendeu:
Comando sum abreviatura de summary que fornece um resumo ou sumário de variáveis numéricas.



No nosso próximo encontro vamos explorar um mais pouco dos gráficos para variáveis numéricas no STATA.

Até lá!

Sandra Brignol

Possui graduação em Bacharelado em Estatística pela Universidade Federal da Bahia (2001), mestrado em Saúde Coletiva pela Universidade Federal da Bahia (2008) e Doutorado em Saúde Pública (2013). Tem experiência em pesquisas na área de Saúde Coletiva, com ênfase em Epidemiologia do HIV, comportamento sexual, uso de álcool e outros psicoativos. Atua como professora de bioestatística, pesquisadora e consultora nas seguintes temáticas: bioética, vulnerabilidade, práticas sexuais desprotegidas, HIV/DST, uso de drogas lícitas e ilícitas. Integra o quadro de consultores da Bioestatística Bureaux. Link para currículo: clique aqui.

Compartilhe :
 
Support : Creating Website | Johny Template | Mas Template
Copyright © 2011. Estatisti.co - All Rights Reserved
Template Created by Creating Website Published by Mas Template
Proudly powered by Blogger