Epi Info versão 6

Epi Info
versão 6

texto disponibilizado em 24/junho/2000

Segunda edição revisada e ampliada por:
Paulo Sérgio Panse Silveira. Epi Info: versão 6. Informática Médica e Telemedicina do Departamento de Patologia da Faculdade de Medicina da Universidade de São Paulo, 2000
<URL:http://www.usp.br/fm/dim/epiinfo/index.php>

(a lista de autores originais consta na primeira edição).

© Informática Médica do Departamento de Patologia da Faculdade de Medicina da USP, 2000
O uso ou reprodução total ou parcial deste material didático é permitido exclusivamente para uso acadêmico ou de ensino que não envolva ganho comercial. Mantenha este texto e o link para http://www.usp.br/fm/dim intactos, e entre em contato conosco através do email silveira@usp.br informando-nos da ocorrência.

Instruções gerais:
como utilizar esta apostila o teclado

Conteúdo

Objetivos
Não tenho o Epi Info: como posso obtê-lo? como instalá-lo?
Apresentando o Epi Info 6
Visão geral
P1 Entrando no programa
P2 Saindo do programa
Eped
P3 Iniciando um questionário
P4 Incluindo campos
P5 Dando nomes às variáveis
P6 Marcando e manipulando blocos de texto
P7 Desenhando Linhas
P8 Salvando seu questionário
P9 Saindo do EPED
P10 Recuperando um questionário
Enter
P11 Criando e usando o questionário
P12 Retomando um questionário
P13 Corrigindo entradas
P14 Saindo do ENTER
Analysis
P15 Entrando no Analysis
P16 O sistema de ajuda
P17 Primeira etapa - Ler um arquivo
P18 Produção de listagens
P19 Ordenação de registros
P20 Distribuição de freqüências
P21 Seleção de registros para processamento
P22 Definindo novas variáveis e modificando valores de variáveis
P23 Tabulações cruzadas
P24 O comando MEANS
P25 Análise estratificada
P26 Títulos
P27 Diagramas e gráficos
P28 Envio dos resultados para a impressora ou para um arquivo
P29 Como fazer um novo arquivo Epi Info
Staticalc
P30 Executando o Staticalc
Epitable
P31 Uso do Epitable
Referências e leituras complementares

Objetivos

Ao final deste texto você deve estar apto a:

descrever o que é o Epi Info e exemplificar o uso dos módulos Analysis, Statcalc e Epitable;
ler um arquivo REC e um arquivo DBF;
produzir uma listagem a partir de um arquivo, definindo quais as variáveis que aparecerão nesta lista;
ordenar os dados de um arquivo baseando-se em diferentes variáveis;
exibir uma distribuição de freqüências e interpretar seu resultado;
selecionar registros para processamento;
criar novas variáveis a partir das existentes;
modificar valores de variáveis;
definir quais os cuidados a se tomar com valores ausentes;
fazer contagens;
fazer análises estratificadas;
gerar e editar diagramas e gráficos, e enviá-los para uma impressora.

Não tenho o Epi Info:
como posso obtê-lo?
como instalá-lo?

O Epi Info é um sistema desenvolvido pelo CDC (Center for Disease Control and Prevention), de domínio público, isto é, destinado a ser distribuído gratuitamente para pesquisadores interessados em colher e analisar dados utilizando ferramental estatístico.

Embora haja vários sites na Web que o distribuem, convém, pelo menos ocasionalmente, para ter certeza de que está recebendo informações atualizadas, consultar a fonte central, o CDC.

Para mais detalhes, consulte:

Informações Gerais: o que é o Epi Info?
Como obter e instalar o Epi Info? e
leia sobre os quais os recursos disponíveis através da Internet, que apresenta o que o CDC oferece para apoio aos usuários.

Depois que tiver o programa instalado em seu computador, siga o roteiro desta apostila para dar seus primeiros passos no Epi Info.

Apresentando o Epi Info 6

Visão geral

O EPED é um processador de textos fornecido para ser uma ferramenta conveniente para a construção de questionários, mas também pode ser usado para correspondência e emissão de relatórios. No entanto, você pode usar outros processador de textos que lhe seja conveniente, desde que produza arquivos de textos em formato ASCII.

ENTER é capaz de ler o questionário produzido pelo EPED e usá-lo como um formulário apresentado na tela do computador, obtendo do arquivo texto as informações necessárias para definir as variáveis e gerando como saída um arquivos de dados.

ANALYSIS é o programa utilizado para explorar os dados obtidos. Lendo o arquivo gerado pelo ENTER ou importando arquivos de dados de outras fontes, é capaz de reorganizar seus dados, estratificá-los, exibir tabelas de freqüência, executar estatística básica, produzir gráficos, etc.

STATCALC, EPITABLE (apresentados aqui superficialmente) e outros programas fornecidos no pacote do Epi Info (não descritos nesta apostila) executam muitos outros procedimentos estatísticos. Há, por exemplo, programas como o CHECK, que é um sistema para auxiliar na verificação da consistência da entrada de dados de um questionário.

P1 Entrando no programa

Para entrar no Epi Info, depende de como executou a instalação (no tópico "Não tenho o Epi Info...", acima, há um acesso com instruções para obter e instalar o Epi Info)

A partir do Windows:
Caso você tenha executado a instrução 4j da Instalação do Epi Info, clique em
Iniciar, Programas, Epi Info Version 6, Epi 6 Menu.

No estilo DOS a partir do Windows:
Clique em Iniciar, Programas, Prompt do MS-DOS. O Windows abre uma janela DOS.
Prossiga como no estilo DOS.

No estilo DOS:
Direcione o computador para o diretório EPI6, digitando:
cd \epi6 e pressione [enter]
e digite:
epi6 e pressione [enter].

Desta forma você obtem o menu principal de Epi Info.

Tela de abertura do Epi Info

Na parte superior do menu, existem as diferentes opções. Programs, a primeira à esquerda, contém os principais programas do sistema Epi Info que usaremos. Para selecionar um ítem do menu:

você pode usar o mouse ou
movimentar a barra iluminada (em verde) com as teclas de seta e , pressionando [enter] quando a opção desejada estiver iluminada (o que abre os itens desta opção) ou
digitar [alt]+[letra em destaque]: [ p ] para Programs, [ t ] para Tutorials, [ a ] para Examples, etc.

Tela de abertura do Epi Info com os itens da opção Manual abertos
Exemplo de itens de uma opção. Manual tem o conteúdo on-line do texto distribuído pelo CDC
(para detalhes leia sobre o arquivo epi6man.exe descrito em "Como obter e instalar o Epi Info")

P2 Saindo do programa

Para retornar ao DOS, estando no menu EPI, pressione [F10]. Caso você tenha acionado algum dos ítens a partir da tela principal apresentada na prática anterior, pode ser necessário utilizar [F10] uma ou algumas vezes para voltar (é padrão, no Epi Info, usar [F10] para sair de qualquer dos programas).

Durante o curso, nós utilizaremos os seguintes programas do Epi Info:

EPED

ENTER

ANALYSIS,

STATCALC e

EPITABLE.

Antes de começar a armazenar dados, você deve fornecer ao Epi Info um questionário que descreva quais são os dados a serem coletados. O programa ENTER usará este questionário para construir o arquivo de dados, no formato .REC, que poderá ser analisado através do ANALYSIS.

Eped

Este programa pode ser utilizado para criar e modificar arquivos contendo questionários que servirão para gerar seu arquivo de dados para análise.

P3 Iniciando um questionário

Há dois métodos possiveis:

usar o EPED (Programs, EPED word processor) ou
ativar o Tutorial, Making a questionnaire e seguir as instruções na tela.

Com qualquer um dos métodos, ao final você deve salvar o questionário em um arquivo com nome de até oito letras e extensão .QES (detalhes na prática P8). Aqui vamos mostrar como proceder usando o primeiro método, que é mais trabalhoso, mas dá maior controle sobre o questionário.

A primeira coisa a fazer é informar ao EPED que você quer produzir um questionário. Pressione [F6] (abre-se um quadro) e depois a barra de espaços até que o modo QES esteja ativo (observe a primeira linha do quadro) e pressione [esc].

P4 Incluindo campos

Daqui em diante, para que o questionário seja corretamente interpretado, é necessário seguir algumas convenções para que o ENTER atribua os nomes e tipos das variáveis (campos, locais onde os dados serão inseridos). Isto é feito pela colocação de "máscaras" indicativas no texto, com sintaxe específica. Como é difícil lembrar das sintaxes disponíveis, o EPED disponibiliza um sistema de ajuda

Instrução: digite [ctrl] + [q] e novamente [q]. Escolha um tipo de variável e, se for o caso, responda às perguntas.

Os tipos disponíveis são:

	____		entrada de texto livre; o número de "_" define o tamanho do campo (no máximo 80)
	## #.###		números; no exemplo, respectivamente, inteiro de dois dígitos e ponto flutuante com 3 casas decimais (por exemplo, 3.142); máximo de 14 caracteres (incluindo o ponto)
	<A >		semelhante a __, com a diferença de que o texto será convertido para LETRAS MAIÚSCULAS e o tamanho do campo é dado pelo número de caracteres entre < e >, incluindo a letra A.
	<Y>		aceita Y (yes, sim), N (no, não), [espaço] ou [enter] (missing) Nota: valores "missing" são representados no ANALYSIS por um ponto. Veja, por exemplo, a figura da prática P6 na variável numcigar. Os indivíduos cujo registro tem um ponto são aqueles dos que não se sabe quantos cigarros fumam (se é que fumam), o que é diferente de ter o valor zero: a certeza de que são não fumantes.
	<dd/mm/yy>		e outros similares, indicam dia, mês, ano e servem para entrada de datas.
	<phonenum>		número de telefone local no formato xxx-xxxx
	<long distance>		similar a <phonenum>, no formato (xxx)xxx-xxxx
	<today> <today/yy> <today/yyyy>		registram a data em que o registro foi gerado ou sua última modificação (baseado no relógio interno do computador, quer precisa estar correto); respectivamente armazenam (1) mês e dia, (2) mês, dia e ano com dois dígitos e (3) mês, dia e ano com quatro dígitos.
	<idnum >		número seqüencial gerado automaticamente, para identificar o registro; o tamanho do número depende do número de caracteres entre < e >, incluindo IDNUM (portanto não pode ser menor que 5 digítos)

Resultado: aparece a "máscara" na posição onde estava o cursor seguindo as especificações solicitadas.

P5 Dando nomes às variáveis

Até aqui você não definiu os nomes das variáveis que o ANALYSIS irá assumir.

Uma entrada como
Nome ___________________ Idade ___ Sexo _
Produzirá as variáveis nome, idade e sexo.

No entanto, há problemas. Uma entrada em duas linhas, sem nada precedendo a segunda, como
Endereco _________________________________
_________________________________________
Criará as variáveis endereco e endereco2

Além disto, o nome da variável apenas pode deixar seu questionário confuso. O EPED contorna este problema, permitindo que você controle o nome da variável. Por exemplo:
Qual o {nome} do entrevistado? ___________________ sexo _
Qual a {idade}? ___
denominará as variáveis com o que aparecer entre { e }.

P6 Marcando e manipulando blocos de texto

Apesar do EPED ser um editor de textos meio primitivo (é de graça, o que é uma grande compensação), há algumas coisas que podem facilitar sua vida. Experimente a tecla [F8] para marcar blocos que podem, a seguir, ser movidos, copiados ou apagados.

P7 Desenhando Linhas

É decorativo, mas bem usada podem melhorar a diagramação de seu questionário e facilitar o trabalho em campo, fazendo divisões na tela.

Instrução: pressione uma vez a tecla [ScrollLock] e use as setas para desenhar.

Resultado: aparecerão linhas na tela

Depois de todo elaborado o seu texto deve ser salvo no formato QES. Você pode também usar o EPED para elaborar as linhas de um programa que poderá ser rodado no ANALISYS. Para isso basta salvar no formato PRG.

Você pode usar a tecla F2 para abrir um novo documento ou mesmo, um documento que já estava gravado. Ainda no EPED é possível fazer midificações no texto inicial como qualquer documento no formato TXT. Faça isso, usando a tecla F8. Assim, você terá acesso a um quadro com diversas opções como: marcar o início ou o fim de um bloco; copiar, mover, deletar, etc.

P8 Salvando seu questionário

Quando terminar, ou de tempos em tempos, tecle [F9] para salvar seu questionário. Na primeira vez, dê-lhe um nome com até 8 letras e extensão .QES no final (por exemplo, TESTE.QES).

O Epi Info, por padrão, sempre salva (e lê) os arquivos no mesmo diretório onde o programa está instalado. Isto é prático, mas não é muito bom, porque vai misturando o que é seu com o que é do Epi Info. Caso venha a existir algum problema no futuro, você pode ser obrigado a "separar" tudo que é seu antes de desinstalar e reinstalar o programa. Caso esteja usando o Windows, sugiro que crie uma ou mais pastas para seus arquivos pessoais: como o Epi Info usa o DOS, o nome desta pasta deve ter, no máximo, 8 letras (não use espaços em branco). Por exemplo, crie no disco rígido local a pasta epidado (que passa a ser vista pelo Epi Info como C:\EPIDADO)

P9 Saindo do EPED

Para sair, como sempre, use [F10].

P10 Recuperando um questionário

Depois que sair do EPED, pode ser que você precise voltar a abrir seu arquivo .QES. Para isto, entre novamente no EPED e tecle [F2]. Solicite Open file this windows, e complete o nome para seu arquivo. Caso não lembre do nome do arquivo, mas saiba em que pasta ele está, dê o caminho completo e termine com *.QES (* significa qualquer). O EPED abre uma lista: basta apontar o seu questionário.

Caso você tenha seguido a recomendação da prática P8, seu caminho será
$C:\EPIDADO\*.QES$

[F2] tem outros usos, como por exemplo salvar uma cópia de um questionário em outra localização e/ou com outro nome, usando Save file to...

Enter

P11 Criando e usando o questionário

Este programa abre o arquivo preparado pelo EPED, abrindo um formulário na tela do computador para a coleta de dados.

Instrução: Tomemos o exemplo da prática P8. Existe um arquivo C:\EPIDADO\TESTE.QES. Abra o ENTER com (Programs, ENTER data). Responda às perguntas fornecendo o nome que seu .REC terá (não precisa ser o mesmo nome do .QES), solicite criar o arquivo a partir de um .QES (2), forneça o nome do .QES e coloque OK: Y, assim:

Resultado: Ao teclar o último [enter], o sistema exibirá o questionário na tela com a aparência que você determinou no EPED.

Instrução: Comece a entrar dados. O Epi Info verifica, por exemplo, nos campos de data, se o formato está correto. Quando chega ao último campo, oferece se quer ou não gravar este registro. Aceite (Y). Entre alguns registros.

Resultado: Parece não ter acontecido nada, mas aconteceu. Seus dados foram armazenados no arquivo .REC que você indicou.

P12 Retomando um questionário

Instrução: É comum que você interrompa sua coleta de dados e precise continuar mais tarde. Faça o mesmo procedimento da prática P11, com a diferença de que fornecerá o nome de um .REC que já existe e escolherá 1. Enter or edit data para prosseguir.

Resultado: O ENTER abre o questionário, como antes. Repare no canto inferior direito da tela onde aparece Rec= (record=registro) e um número que corresponde ao registro atual.

P13 Corrigindo entradas

Instrução: É mais fácil se você não cometer erros, e no ANALYSIS há ferramentas meios mais cômodos para eliminar registros imperfeitos, mas o ENTER pode adiantar o serviço: Use [ctrl] + [f], tecle [F2] e responda com o número de registro que deseja para voltar a exibí-lo na tela. Corrija e volte a salvar.

Resultado: Edição não é o forte do ENTER. Você provavelmente vai achar melhor deixar para consertar os erros no ANALYSIS.

P14 Saindo do ENTER

Instrução: Quando acabar, saia com [F10].

Analysis

O programa ANALYSIS produz listas, distribuição de freqüências, tabelas, estatísticas e gráficos. Comandos simples farão o ANALYSIS selecionar registros usando critérios especificados, ordenar ou listar registros, construir distribuições de freqüências ou tabulações cruzadas, realizar operações lógicas ou matemáticas sobre uma variável, colocar os resultados em uma nova variável, e direcionar os resultados para a tela, impressora ou arquivo de disco.

P15 Entrando no Analysis

Para executá-lo selecione a partir do menu principal: Programs, ANALYSIS of data.

Abertura: ANALYSIS

Quando se executa o ANALYSIS a partir do menu principal do Epi6, vê-se uma janela inferior para introduzir os comandos e uma maior, acima, onde os resultados dos comandos vão aparecer. No rodapé da janela inferior são apresentados alguns comandos importantes e, no cabeçalho da janela superior há informações sobre os arquivos de dados e memória disponível.

Sempre que o cursor ( ) estiver em EPI6> pode-se introduzir comandos a partir do teclado.

Analysys: o cursor

Por isto esta localização é também chamada de linha de comando.

Se você cometer algum erro durante a digitação, use a tecla [backspace] ou (seta para a esquerda) para retornar à posição correta e fazer a devida correção. A tecla [del] apaga caracteres e [ins] funciona alternando a função inserte para ativa ou não ativa (insere caracteres "empurrando" os que estão adiante, ou escreve sobrepondo o texto). As teclas [home] e [end] fazem o cursor "saltar" para o começo ou final da linha corrente.

À medida que os resultados aparecem na tela superior, aqueles que rolaram para fora da vista no alto da tela podem ser vistos de novo, pressionando-se [PageUp] e [PageDn] para movimentar a tela para cima e para baixo.

P16 O sistema de ajuda

A lista de comandos em ANALYSIS pode ser vista pressionando a tecla [F2]. Eles aparecem em uma janela adicional que se abre na tela. Ilumine, selecione o comando desejado e tecle [enter] ou tecle [esc], fechando a janela adicional, e digite diretamente pelo teclado.

Com um comando digitado na linha de comando, pressionando-se a tecla [F1] (a tecla de ajuda) aparecerão informações sobre o mesmo, incluindo o formato dos parâmetros que podem e/ou devem ser fornecidos.

Caso nenhum comando tenha sido digitado, a tecla [F1] faz aparecer uma lista de tópicos; quando se seleciona um tópico, obtém-se informações sobre ele.

P17 Primeira etapa - Ler um arquivo

Arquivos a serem analisados pelo Epi Info, podem ser produzidos

com uma entrada de dados através do programa ENTER (Programs, ENTER data), que produz um arquivo Epi Info (com extensão .REC);
um arquivo dBbase (com extensão .DBF) vindo de outra fonte (dBase, Fox, Excel, etc.);
a partir de vários outros formatos pelo programa IMPORT (Programs, IMPORT files)

O comando que diz a ANALYSIS qual o arquivo de trabalho é READ <nome do arquivo>. É o comando que torna este arquivo ativo para a análise. Em geral, este é o primeiro utilizado em uma seção do ANALYSIS, pois sem um arquivo ativo, não existe o que analisar. Exemplos da sintaxe correta:

EPI6> READ pacpad (é entendido como pacpad.rec)

EPI6> READ pacpad.rec

EPI6> READ pacpad.dbf (para arquivos dBase)

EPI6> READ C:\dbase\pacpad.rec (arquivo REC em outro diretório)

Em geral o Epi Info, como outros programas DOS, não são sensíveis às letras maiúsculas ou minúsculas. Apenas por convenção, neste texto, manteremos os comandos grafados em maiúsculas e os parâmetros e variáveis em minúsculas.

Quando não é colocada a extensão, o ANALYSIS presume que é um arquivo Epi Info (extensão .REC). Para ler um arquivo dBase é necessário colocar explicitamente a extensão .DBF. Caso você não se lembre do nome do arquivo, comande (se o arquivo estiver no diretório EPI6, junto com o programa)

EPI6> READ

ou (se o arquivo está em outra localização)

EPI6> READ <caminho>

Você pode comandar para exibir os arquivos dBase disponíveis com

EPI6> READ *.dbf

Você também pode combinar as sintaxes anteriores para ver quais os arquivos disponíveis em uma pasta específica (por exemplo, para exibir todos os arquivos .DBF na pasta temp em meu disco rígido):

EPI6> READ c:\temp\*.dbf

O comando cls limpa as telas. read c:\temp\*.dbf faz com que o ANALYSIS exiba na janela adicional os arquivos do tipo .DBF disponíveis na pasta temp, que por sua vez está ancorada na raiz do disco rígido c:\. Note que, no estilo do DOS, o que separa os níveis (pastas, pastas subordinadas a outras pastas ou arquivos dentro de pastas) são barras invertidas (\).

Mais uma alternativa é comandar

EPI6> READ *.dbf

e navegar pelas pastas na tela adicional, usando as setas ( ). Note que ..\ significa "ir para um nível acima" (para a pasta à qual a pasta atual está subordinada).

Para praticar, se você não tem nenhum arquivo para usar, comande READ e abra algum dos .REC que o Epi Info traz como exemplo.

P18 Produção de listagens

Para obter listagens dos registros em um arquivo, digite:

EPI6> LIST

O comando LIST exibirá apenas as variáveis que cabem na largura da tela. O comando LIST seguido por um ou mais nomes de variáveis lista apenas essas variáveis. Esse é um meio prático de obter uma lista com apenas os ítens que interessam, por exemplo lista dos nomes e endereços de pessoas a serem entrevistadas. Para listar mais de uma variável deixe um espaço entre elas, sem vírgula. Por exemplo:

EPI6> LIST nome endereco

Para uma lista das variáveis do arquivo em uso, pressione a tecla [F3] e escolha a partir da lista que aparece na janela (ou, se for capaz de lembrar, digite seu nome diretamente pelo teclado). Caso não deseje selecionar nenhuma variável diretamente, a janela é destivada pressionando-se a tecla [esc].

Observe a mensagem na tela de abertura do ANALYSIS (prática P3), informando que está usando o padrão de 60 linhas e 80 colunas: comandos que gerarem respostas mais longas (como LIST) farão com que o ANALYSIS pare a cada bloco de 60 linhas exibindo a palavra <more>.

Embora seja possível rever o texto que está acima da primeira linha da janela superior com as teclas pressionando-se [PageUp] e [PageDn] você pode preferir que a tela avance em passos menores que 60 linhas. Neste exemplo, a tela exibe o comando SET page=17,80, que alterou a saída para blocos de 17 linhas e 80 colunas antes do list. O ANALYSIS continuará repeitando este tamanho de bloco de texto até ordem em contrário.

Na listagem acima é importante salientar o jargão das pessoas que lidam com bancos de dados: cada registro é uma linha que contém todos os valores das variáveis de um indivíduo; cada coluna corresponde à um campo, que contém o valor de uma variável deste indivíduo. Registros como sinônimos de linhas e campos como de variáveis costumam ser mencionados indistintamente na linguagem corrente.

P19 Ordenação de registros

Algumas vezes é importante que os registros em um arquivo sejam arranjados em uma determinada ordem - por exemplo, alfabeticamente por nome ou numericamente por idade. Isto é particularmente útil para o comando LIST. Os registros são temporariamente rearranjados na nova ordem e podem ser LISTados.

O comando SORT fará isto para vários campos ao mesmo tempo, quando se desejar. Por exemplo, supondo que haja uma variável sexo codificada com f para feminino e m para masculino; o comando:

EPI6> SORT sexo

ordena alfabeticamente (f,m), separando a população de acordo. Para verificar o efeito, dê o comando:

EPI6> LIST nome sexo

Já o comando:

EPI6> SORT sexo idade

colocaria os registros em ordem por sexo, com as idades ordenadas dentro de cada categoria (f e m). Verifique o que aconteceu com o comando:

EPI6> LIST nome sexo idade

A ordenação resultante do comando SORT desaparece com o próximo comando READ ou quando você sair do ANALYSIS. Não é necessário ordenar registros para fazer tabelas ou distribuições de freqüências, uma vez que as tabulações são automaticamente ordenadas pelo programa.

P20 Distribuição de freqüências

O comando FREQ irá contar os elementos de cada categoria de uma variável especificada e dirá as freqüências absolutas e relativas para cada categoria. É utilizado para dados categóricos tais como sexo, raça, presença ou ausência de doença, etc. O comando:

EPI6> FREQ sexo

dará o número de indivíduos em cada categoria (f e m), seguido pela porcentagem em relação ao total e a porcentagem acumulada (freqüências).

Desativa-se STATISTICS com o comando

EPI6> SET statistics=off

e ativa-se STATISTICS com o comando

EPI6> SET statistics=on

Sendo as variáveis numéricas, a soma, a média e o desvio padrão serão também apresentados. Se /c é acrescentado após o comando FREQ

EPI6> FREQ sexo /c

o resultado incluirá os intervalos de confiaça para cada valor:

P21 Seleção de registros para processamento

ANALYSIS normalmente processa todos os registros em um arquivo. Pode-se, no entanto, selecionar registros para o processamento, com base em determinados critérios. Os comandos seguintes, por exemplo, irão selecionar apenas homens com idades de 20 a 49 anos (supondo que o campo idade contém números inteiros):

EPI6> SELECT sexo = "m"
EPI6> SELECT idade < 50
EPI6> SELECT idade > 19

Instruções SELECT sucessivas acumulam-se. É equivalente à utilizar o operador AND:

EPI6> SELECT sexo = "m" AND idade <50 AND idade >19

Portanto é necessário ter cuidado com aspectos lógicos. As instruções:

EPI6> SELECT sexo = "m"
EPI6> SELECT sexo = "f"

não selecionarão registro algum, pois nenhum registro tem a variável sexo estabelecida simutâneamente para "m" e "f". Já o comando:

EPI6> SELECT idade > 19 OR idade < 50

irá selecionar todos os registros (se a intenção fosse o intervalo de 20 a 50, o operador precisaria ser AND).

EPI6> SELECT idade > 19 AND idade < 50

O comando SELECT pode ser usado para omitir registros. Se você quiser eliminar da análise registros de pacientes com creatinina < 2 (o valor da dosagem de creatinina está na variável creat), o comando:

EPI6> SELECT creat >= 2

irá omiti-los no processamento.

Se quiser analisar apenas pacientes do sexo feminino, os comandos:

EPI6> SELECT sexo = "f"

EPI6> SELECT sexo <> "m"

são equivalentes porque <> significa "diferente de".

As condições de SELECT permanecem em efeito até que outro arquivo seja lido (READ), você saia do ANALYSIS ou sejam canceladas com o comando SELECT sem outras especificações:

EPI6> SELECT

Não se esqueça de que SELECT é aditivo e sempre que se deseja analisar outras variáveis é conveniente "limpar" SELECTs anteriores com o comando "SELECT" apenas.

P22 Definindo novas variáveis e modificando valores de variáveis

Para a análise de dados, podem ser necessárias várias operações de "limpeza" tais como recodificar variáveis. Para tanto, deve-se criar novas variáveis onde os resultados de recodificação ou de outras operações são colocados temporariamente. Essas variáveis definidas desaparecerão quando você sair do ANALYSIS ou o comando READ é utilizado.

Entretanto, você pode querer preservar sua recodificação permanentemente. Há como fazer isto, criando outro arquivo com o comando WRITE, descrito abaixo.

Para definir uma nova variável, utiliza-se o comando DEFINE <nome da variável>, seguido pelos símbolos: _ ("undescore"), para qualquer tipo de caracteres, ou #, para valores numéricos. O largura da variável é determinada por quantas vezes esses símbolos são repetidos. Exemplos:

EPI6> DEFINE nome _______________

EPI6> DEFINE creatalt ____

EPI6> DEFINE pamedia ###

EPI6> DEFINE custo ###.##

Para atribuir valores à nova variável, pode-se utilizar o comando LET, como nos exemplos:

EPI6> DEFINE idade2 ##

EPI6> LET idade2 = idade

ou fazer operações matemáticas, como:

EPI6> LET pamedia = padiast + ((pasist - padiast )/3)

Outra forma de determinar valores é utilizar uma função IF para atribuir valores a essa nova variável. Suponha que temos uma variável (padiast) que contém os valores medidos de pressão diastólica. Deseja-se comparar pessoas com pressão maior que 90 mmHg com aqueles que tem nível inferior a esse valor, podemos utilizar os seguintes comandos:

EPI6> DEFINE pad #

EPI6> IF padiast > 90 THEN pad = 1 ELSE pad = 2

Desta forma a variável pad = 1 representará pacientes com pressão arterial diastólica elevada e pad = 2, aqueles com essa pressão normal. Essa divisão entre normal e alterada facilita muito algumas análises, como por exemplo as tabulações cruzadas, como veremos a seguir.

Em outra situação pode-se criar uma variável que contenha um texto declarando, por exemplo, se o nível de creatinina sérica está alterado ("alt") ou normal ("norm"), a partir de uma variável creat, pré-existente, que contém um valor numérico medido (considerando que creatinina sérica superior a 2,0 indica um nível alterado):

EPI6> DEFINE creatalt ____

EPI6> IF creat >= 2 THEN creatalt = "alt" ELSE creatalt = "norm"

A cláusula ELSE na instrução IF é utilizada para especificar o que deve acontecer se as condições não forem preenchidas. Sem o ELSE, os registros apenas serão alterados quando a condição estabelecida em IF for verdadeira.

Deve-se tomar cuidado com valores ausentes ("missing"), que se estiverem presentes serão codificados respectivamente com o valor 2 e "norm" nos exemplos acima, pois não satisfazem a condição inicial.

Freqüentemente, precisamos recodificar os valores de variáveis para a análise dos dados. É possível fazer operações matemáticas ou selecionar valores a serem modificados apenas se determinado criério é satisfeito, como nos exemplos acima. Às vezes, é conveniente agrupar valores e pode-se fazer isso com o comando RECODE. Para tanto, deve-se antes definir uma variável do tipo caracter. Por exemplo, se quisermos agrupar os valores da variável idade em grupos de 10 anos (0-9, 10-19, 20-29, etc), usamos:

EPI6> DEFINE idadecat ___

EPI6> RECODE idade TO idadecat BY 10

P23 Tabulações cruzadas

O comando TABLES, como o comando FREQ, é utilizado para dados categóricos (sexo, raça, presença ou ausência de doença, etc.) e contará os registros cujos valores preencham critérios para os dois campos ao mesmo tempo. Assim, o comando:

EPI6> TABLES sexo pad

apresentará como resultado a contagem de homens e de mulheres com ou sem pressão arterial sistólica elevada.

Além disso, após a tabela com esses resultados, o ANALYSIS mostra os resultados da avaliação estatística dos dados.

Uma razão de probabilidades ("odds ratio") diferente de 1 pode indicar associação entre as variáveis cruzadas. A sua interpretação depende da orientação dos dados na tabela. Em um estudo caso-controle, o risco relativo deve ser ignorado, uma vez que sua interpretação não tem significado neste tipo de estudo. Para o teste do Qui-quadrado, são estatisticamente significativos os valores de p < 0.05, quando se aceita intervalo de confiança de 95%.

P24 O comando MEANS

O comando MEANS (para dados numéricos que são contínuos ou ordenáveis, tais como peso, altura e idade) produz uma tabela com os dados contínuos ou ordinais e a seguir calcula as estatísticas apropriadas.

O comando MEANS pode também se utilizado com dois ítens de informação - a variável que contém os dados que vão ser analisados e a seguir a variável que indica como se distinguem os grupos.

O sintaxe do comando é:

EPI6> MEANS <variável numérica a ser analisada> <variável de agrupamento>

Por exemplo, supondo as variáveis idade e pad (pressão arterial diastólica) usando o comando:

EPI6> MEANS idade pad

Você obterá os dados estatísticos necessários para analisar a importância da idade em relação à elevação da pressão arterial, como por exemplo a idade média do grupo com pressão arterial elevada e do grupo com pressão arterial normal.

Os valores de p são utilizados para determinar se existe diferença entre categorias da variável de agrupamento em relação à variável a ser analisada.

P25 Análise estratificada

Quando se lista mais de duas variáveis no comando TABLES ou MEANS obtém-se uma série estratificada de tabelas. As variáveis após as duas primeiras servem como base para dividir as tabelas em estratos. Por exemplo:

EPI6> TABLES creatalt pad sexo

produzirá tabelas separadas cruzando informações do nível de creatinina sérica com as de pressão arterial para homens e mulheres. A análise estratificada de Mantel-Haenszel será apresentada após as duas tabelas. Os ORs (odds ratio) apresentados referem-se às associações entre creatinina e pressão, enquanto o OR ponderado de Mantel-Haenszel resume os resultados da estratificação por sexo.

P26 Títulos

O comando TITLE permite especificar até cinco linhas de texto que aparecerão no alto de uma tabela, distribuição de freqüência, diagrama ou gráfico. TITLE pode ser usado antes dos comandos TABLES, FREQ, e gráficos para produzir um título apropriado para os resultados. Para cancelar o efeito depois do comando ter sido executado, TITLE pode ser usado novamente, com espaços em branco ou novo texto para o próximo comando. Os comandos seguintes definirão um título de 2 linhas para os comandos subseqüentes:

EPI6> TITLE 1 - Análise da relação da pressão arterial com sexo
EPI6> TITLE 2 - Hosp. das Clínicas, agosto de 1995.

Para remover a primeira linha do título, pode-se usar:

EPI6> TITLE 1

P27 Diagramas e gráficos

O programa ANALYSIS produz histogramas, diagramas de dispersão, gráficos de setores (pizza), de barras de linha, diretamente a partir dos arquivos de dados. São utilizados todos os dados ou aqueles que tiverem sido selecionados pelo comando SELECT. Para fazer um gráfico basta um único comando, como se vê a seguir:

EPI6> HISTOGRAM idade

EPI6> PIE pad

EPI6> BAR idadecat

EPI6> LINE creatalt

EPI6> SCATTER creat padiast

EPI6> SCATTER creat padiast /R

O último exemplo apresenta no final /R, que acrescenta uma linha da regressão obtida por mínimos quadrados.

Para se comparar dois gráficos deve-se ter escalas iguais no eixo vertical, o que se obtém acrescentando-se uma barra transversal (/) ao comando, especificando-se o valor máximo do eixo de Y (o valor menor deve ser 0), como em:

EPI6> BAR creat / Y = 0 - 50

P28 Envio dos resultados
para a impressora ou para um arquivo

Antes de usar os comandos de impressão, assegure-se de que uma impressora esteja conectada ao computador, ligada e abastecida de papel. Pressionar a tecla "Printer on" ([F5]) enviará todos os resultados subseqüêntes para a impressora.

Não serão impressos resultados que já estejam na tela. O melhor modo de imprimi-los é acionar a impressão com [F5] e depois apertar a tecla de seta "para cima" (que recupera o comando anterior) seguido de [enter] o que irá executar o comando novamente mas, desta vez, os resultados serão impressos. Vale também para os gráficos.

Para desativar a impressão, aperte [F5] novamente. Isso redirecionará os resultados para a tela.

P29 Como fazer um novo arquivo Epi Info

Algumas vezes é útil criar um novo arquivo Epi Info, que contenha os registros de variáveis selecionadas, ou com seu valor alterado por alguma operação feita, ou ainda para tornar definitivas variáveis que foram definidas com DEFINE.

Isto pode ser feito com os seguintes comandos:

EPI6> ROUTE <nomedoarquivo.REC>
EPI6> WRITE RECFILE
EPI6> ROUTE SCREEN

O comando ROUTE direciona os resultados para o novo arquivo. É importante incluir a terminação .REC como parte do nome do novo arquivo, uma vez que arquivos Epi Info devem ter este sufixo.

O comando WRITE seguido de RECFILE cria um arquivo com formato Epi Info. Este comando pode ser seguido com uma lista de nomes de variáveis separadas por espaços. Desta forma, apenas as variáveis listadas serão incluídas no novo arquivo. Se SELECT foi utilizado, apenas os registros ativos (selecionados) serão incluídos.

O comando ROUTE SCREEN fecha o arquivo e direciona os resultados seguintes para a tela novamente.

Staticalc

O STATICALC constitui um calculador estatístico para tabelas simples e estratificadas. Executa cálculos estatísticos para dados introduzidos a partir do teclado, em tabelas apresentadas na tela.

P30 Executando o Staticalc

Execute STATICALC a partir do menu principal do Epi Info (Programs, STATCALC calculator). Aparecerá um menu, contendo as seguintes opções:

significando, respectivamente, tabelas 2 x 2 e 2 x n, tamanho de amostra, e qui quadrado para tendência.

Para selecionar, mova o cursor para a opção desejada, com as teclas de seta e pressione [enter]. Telas de ajuda contendo informação sobre o programa e os métodos estatísticos são exibidas quando pressiona-se [F1].

Aqui exemplificaremos apenas com a opção para tabelas: quando essa opção é selecionada, aparece na tela uma tabela 2x2. Para a análise estatística de tabela 2x2 simples, deve-se introduzir quatro números na tabela e depois pressionar [F4] para executar os cálculos. STATICALC calcula a razão de probabilidade ("odds ratio") e o risco relativo com limites de confiança, três tipos de teste de qui-quadrado e, se preciso, o teste exato de Fisher. Depois de terem aparecido esses resultados, você pode optar por requisitar limites exatos de confiança. Estes são particularmente úteis se os números na tabela forem pequenos.

Para tabelas 2 x 2, podem ser introduzidos estratos adicionais pressionado a tecla [F2] após o aparecimanto das estatísticas. Após a introdução de todos os estratos, a tecla [F4] apresentará os resultados da análise estratificada e a oportunidade de se estimar os intervalos de confiaça exatos.

Para tabelas simples com até 10 caselas na dimensão vertical, simplesmente continue a digitar os números, seguidos por um [enter]. STATICALC fará o qui-quadrado para a tabela 2 x n.

A estatística produzida por STATICALC é semelhante à obtida a partir de arquivos de dados pelo programa ANALYSIS.

A impressão de cálculos é feita da mesma forma que em ANALYSIS utilizando-se a tecla [F5].

Epitable

P31 Uso do Epitable

EPITABLE é executável a partir do menu principal (Programs, EPITABLE calculator). Possui um menu com várias opções, e consiste em uma série de programas com muitas funções estatísticas e gráficas disponíveis. Dentre estes programas, Probability pode ser utilizado para calcular o valor de p, quando se conhece o valor do qui-quadrado ou do t de Student e seus respectivos graus de liberdade associados. Com esse programa, é possível também calcular o valor de p para dados de distribuição binomial ou de Poisson.

Como esta apostila pretende prover apenas um contato introdutório com o Epi Info, foge ao seu escopo explicar cada técnica estatística embutida no sistema. O objetivo aqui é mostrar que os recursos existem para que o aluno, depois que estiver habilitado em estatística, possa buscá-los e interpretá-los corretamente.

Referências e leituras complementares

CDC. Epi Info's home page.
<URL:http://www.cdc.gov/epo/epi/epiinfo.php>
(site oficial do CDC: manuais, download, lista de discussão e outros recursos)

Newrick D. Epi Info general practice. Family Practice Information Site, 1999.
<URL:http://www.staff.ncl.ac.uk/d.c.newrick/epiinfo/>

Straub T. Epi Info Manual. Knowledge Management in Health Services, University of Washington, Seattle, WA.
<URL:http://courses.washington.edu/hs590a/modules/16/questionnaire.php>

Disciplina Asa 2000 (Administração em Serviços de Alimentação). Epi Info. Curso de Nutrição da Universidade Federal da Bahia (UFBA).
<URL:http://www.geocities.com/Eureka/Office/5581/infoplay5.php>
(instruções, dicas e email para dúvidas)

L@ampada. Aplicação da Informática à Epidemiologia Clínica. Universidade Estadual do Rio de Janeiro (UERJ).
<URL:http://www.lampada.uerj.br/epiinfo.php>
(local alternativo para obtenção do software e acesso à uma lista de discussão sobre Epi Info)