Orientações sobre Cálculo Amostral


Introdução


Quando fazemos uma pesquisa científica estamos querendo responder uma questão de forma a obter uma resposta cientificamente válida.
Na área da saúde as questões a que queremos responder normalmente se referem a uma população de pessoas e não a apenas algumas delas.
Como na grande maioria das vezes é impossível estudar a população toda para qual queremos obter a resposta nós estudamos amostras das populações e não a população toda.
Uma amostra é uma parte da população com finalidade de representá-la na pesquisa. Queremos que nossa amostra seja exatamente igual a população a ser representada. Para termos uma amostra com a “cara” da população precisamos selecionar uma amostra com “qualidade” e “quantidade” suficiente.
A “qualidade” deve ser garantida pelo pesquisador utilizando técnicas de seleção da amostra por sorteio, representar todos os estratos da população, fazer pareamento quando necessário, etc. Já a “quantidade” diz respeito ao número suficiente de elementos na amostra para que a pesquisa consiga atingir o objetivo proposto que é a resposta a questão por meio do método científico.
Em nosso processo de cálculo amostral estaremos supondo que o pesquisador já sabe como garantir a qualidade da amostra e, portanto, só estaremos focando no tamanho da amostra.
A quantidade (tamanho da amostra) pode, e deve ser, calculada matematicamente para que a pesquisa atinja seu objetivo da maneira mais eficiente possível.
Uma amostra maior do que a necessária pode até responder a questão da pesquisa, porém a um custo e tempo maiores do que o necessário. Uma amostra menor do que a necessária pode não responder satisfatoriamente a questão, e consequentemente ser um desperdício de tempo e dinheiro.

Como calcular o tamanho da amostra


Não existe um número padrão de tamanho da amostra, para cada pesquisa vai existir o tamanho adequado.
Vamos supor um exemplo. Queremos responder cientificamente quantos por cento da população (prevalência) adulta da cidade X tem pelo menos um dente cariado. A população de adultos da cidade X é 100.000 habitantes, logo não conseguiremos examinar toda a população, vamos trabalhar com uma amostra. Quantos sujeitos devo examinar (qual o tamanho adequado da amostra)? Dez, 50, 100, 1.000, 10.000?
Qualquer que seja o tamanho da amostra eu terei como resposta a porcentagem de adultos com cárie da amostra, mas o que queremos saber é quantos por cento da população tem cárie, não apenas da amostra.
Vamos supor que todos da população (100%) tem pelo menos uma cárie. Se isso ocorrer minha amostra poderia ser de apenas um sujeito que o obtido na amostra seria exatamente a resposta que estou procurando na população. Minha amostra é de um sujeito ele tem cárie, logo 100% da amostra tem cárie, e eu acerto que 100% da população tem cárie. Nesse caso uma amostra de tamanho 1 é a mais eficiente possível. Mas vamos supor que metade (50%) da população tenha cárie e a outra metade (50%) não tenha. Agora se pegamos uma amostra de tamanho um com certeza erraremos nossa previsão da população. Se o sujeito da amostra tiver cárie vamos achar que 100% da população tem cárie, e se o sujeito da amostra não tiver cárie acharemos que 100% da população é livre de cárie. Repare que o tamanho da amostra nas duas situações é o mesmo (um) e o tamanho da população também é o mesmo (100.000 habitantes). Por que em uma situação o tamanho da amostra foi suficiente para responder corretamente a questão e na outra situação não foi suficiente? A resposta é simples, porque no primeiro exemplo a população era homogênea (todos tinha cárie) enquanto na segunda situação não havia essa homogeneidade total (50% tinham cárie e 50% não tinham).

GRAU DE HETEROGENEIDADE DA POPULAÇÃO
Desse exemplo fictício surge a primeira, e talvez mais importante, regra para se calcular o tamanho da amostra: só podemos calcular o tamanho da amostra se soubermos o grau de heterogeneidade da população. Como regra geral temos que quanto mais heterogênea é a população maior será o tamanho da amostra necessário para representa-la. Não há outra maneira, se não soubermos previamente o que esperar da população não será possível calcular o tamanho da amostra. Mas como posso saber o quanto a população é heterogênea se justamente estou querendo estuda-la porque não sei quantos por cento tem cárie? Para previamente sabermos o grau de heterogeneidade da população temos três soluções:
1) Buscar na literatura algum estudo semelhante ao que estamos fazendo e verificar qual foi o grau de heterogeneidade encontrado. Então assumimos que nossa população de estudo deve ter um grau de heterogeneidade semelhante ao do estudo já publicado.
2) Fazer um “estudo piloto” com um pequeno número de casos para explorar a população e ter uma noção de seu grau de heterogeneidade.
3) Estimar o maior grau de heterogeneidade possível da população.

MÉTODO ESTATÍSTICO QUE SERÁ UTILIZADO PARA ANALISAR OS DADOS
Para o cálculo amostral é necessário primeiramente determinar qual é o objetivo principal da pesquisa. Isto é, qual a questão central que queremos responder, pois nela será baseado o cálculo do tamanho da amostra. Muitas vezes queremos responder várias questões com a pesquisa, mas é necessário eleger a questão principal.
Definida a questão central será necessário determinar qual o método estatístico será utilizado para responder essa questão. Por exemplo, se o objetivo principal de nossa pesquisa é determinar a prevalência de cárie nos adultos e vamos analisar o resultado por meio do Intervalo de Confiança (IC) de uma Proporção o cálculo amostral utilizará a fórmula de cálculo do Intervalo de Confiança para determinar o tamanho da amostra necessário. Já se fizermos uma pesquisa para determinar se existe diferença entre homens e mulheres quanto ao número médio de dentes cariados, e pretendemos utilizar o teste “t” para fazer a comparação entre essas duas médias, o cálculo amostral utilizará agora a fórmula de cálculo do teste t para determinar o tamanho da amostra. Então sempre será necessário saber previamente o procedimento estatístico que utilizaremos para analisar a questão central da pesquisa.

PRECISÃO DA ESTIMATIVA
Outro fator importante no cálculo amostral é determinar previamente o grau de precisão que desejo da minha estimativa baseada na amostra, com relação à população. No nosso exemplo qual o tamanho do erro que estou disposto a cometer na estimativa do porcentual de adultos com cárie na população. Para não haver possibilidade de erro nenhum na estimativa seria necessário pesquisar a população inteira. Cada vez que admitimos um menor erro teremos um tamanho de amostra maior. No nosso exemplo, com nível de confiança de 95%, se quisermos cometer um erro máximo de 5% será necessária uma amostra de 384 sujeitos. Já se quisermos cometer um erro máximo de 1% será necessária uma amostra de 9.604 sujeitos.
É necessário preestabelecer a precisão deseja de acordo com o procedimento estatístico a ser empregado. Assim, no exemplo de determinar a prevalência de adultos com cárie na população é necessário de definir previamente qual o erro máximo que vamos admitir (p.ex. 5%) e também qual o nível de confiança que será adotado (p.ex. 95%), isto é, qual a confiança que temos daquela estimativa estar correta para a população. Já no exemplo da comparação entre homens e mulheres quanto a média de dentes cariados é necessário pré- estabelecer qual nível de significância a ser adotado na aplicação do teste t (p.ex. 5%), o poder da amostra (p.ex. 80%), e a menor diferença entre os grupos que tem relevância clínica (p.ex. 0,5 dentes cariados).

ERRO α ou NÍVEL DE SIGNIFICÂNCIA
Quando a análise da pesquisa será feita por algum teste de hipótese é necessário se determinar qual o nível de significância (Erro α) que será utilizado na interpretação do resultado do teste de hipótese. Erro &alpha é a probabilidade de se estar errado ao aceitar a Hipóstese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor. Quanto menor o erro α adotado maior deverá o tamanho da amostra.

ERRO β ou PODER DA AMOSTRA
O Poder da amostra é igual a 1 menos o Erro β. (PODER = 1 – ERROβ).
Quando a análise da pesquisa será feita por algum teste de hipótese é necessário se determinar qual o Erro β (ou Poder) que se deseja que a amostra tenha. Erro β é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Poder é a probabilidade de corretamente aceitarmos H1 quando essa realmente é verdadeira. Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%. Se utilizarmos Erro β=10% estamos dizendo que queremos Poder=90%. Quanto menor o erro β (consequentemente maior o Poder) adotado maior deverá o tamanho da amostra.

TAMANHO DA POPULAÇÃO
Toda fórmula de cálculo de tamanho da amostra é desenvolvida partindo do princípio que a população que ela pretende representar é infinita. Somente quando trabalhamos com população pequena (menor do que 2.000 elementos) compensa ajustar o tamanho calculado para o tamanho da população. No sistema existe a opção de se ajustar o tamanho da amostra para o tamanho de uma população finita.

EFEITO DO DESENHO
Toda fórmula de cálculo de tamanho da amostra é desenvolvida partindo do princípio cada elemento da amostra é selecionado aleatoriamente (sorteio) e um a um (amostragem aleatória simples). Muitas vezes isso não ocorre e utilizamos sorteio por conglomerados. Por exemplo, ao selecionarmos alunos da rede de ensino sorteamos uma escola, ou uma classe, e não um aluno de cada vez. Isto leva a um desvio do modelo original para o qual a fórmula foi desenvolvida. Nestas situações, para se corrigir esse desvio no desenho amostral utiliza-se um fator de correção que irá aumentar o tamanho necessário da amostra. Esse fator chamamos “Efeito de desenho” e, normalmente, se utiliza um fator de correção entre 1,2 e 2, sendo mais comum se utilizar o fator 1,5.

PERDA DE ELEMENTOS
O cálculo amostral indica o número ideal de elementos que devemos avaliar na pesquisa. Principalmente nas pesquisas longitudinais é comum haver perda de elementos ao longo da pesquisa. Para corrigir essa quantidade que elementos que podem se perder ao longo da pesquisa é necessário começar a pesquisa com um número maior do que o calculado. Para saber o número ideal de se iniciar a pesquisa é preciso ter uma estimativa do percentual de perdas que podem ocorrer durante a pesquisa. Ao entrar com esse percentual de perdas previstas o sistema ajusta o cálculo do tamanho da amostra para compensa-las.


Cálculo do Tamanho da Amostra


Como dito anteriormente, para cada método de análise dos dados exige certas informações para o correto cálculo amostral. Abaixo segue a relação dos procedimentos estatísticos para os quais o sistema executa o cálculo amostral com uma explicação dos parâmetros necessários para execução do cálculo.

1 - Intervalo de Confiança de uma Proporção

Utilizado quando se deseja determinar a proporção (prevalência) de uma característica em uma população. Por exemplo, determinar qual a proporção de sujeitos com cárie na população adulta brasileira. O resultado será apresentado assim: Prevalência de cárie = 47,6% (IC95%: 44,3 – 50,9%).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Erro (%): margem de erro máximo que o pesquisador admite na sua pesquisa.
- Proporção esperada (%): a proporção (prevalência) que o pesquisador estima que vai encontrar na população com a caraterística sendo estudada. Essa estimativa pode vir da literatura, de um projeto piloto, ou adotar 50% que é a maior variabilidade possível pois assim o tamanho da amostra calculado atenderá para qualquer que seja a prevalência encontrada.

2 - Intervalo de Confiança de uma Média

Utilizado quando se deseja determinar a média de uma característica quantitativa em uma população. Por exemplo, determinar qual o peso médio da população adulta brasileira. O resultado será apresentado assim: Peso médio = 72,3Kg (IC95%: 70,2 – 74,4Kg).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Erro: margem de erro máximo, na unidade de medida da variável avaliada, que o pesquisador admite na sua pesquisa.
- Desvio padrão estimado: o desvio padrão que o pesquisador estima que vai encontrar na população com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

3 - Diferença entre duas Proporções (Teste do qui-quadrado)

Utilizado quando se pretende determinar se existe diferença na proporção (prevalência) de uma caraterística entre duas populações. Por exemplo, determinar se existe diferença na prevalência da cárie dentária entre as populações de homens e mulheres brasileiros. O cálculo pressupõe que o pesquisador utilizará o teste do qui-quadrado para fazer a comparação. Como todo teste de hipótese o resultado será um valor de “p” que é a probabilidade de se errar ao aceitar a hipótese alternativa (H1), que no caso é a hipótese de que há diferença entre as duas populações.
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Estimativa de P1: a proporção (prevalência) que o pesquisador estima que vai encontrar na população1 (P1) com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.
- Estimativa de P2: a proporção (prevalência) que o pesquisador estima que vai encontrar na população2 (P2) com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.
- Desvio padrão estimado: o desvio padrão que o pesquisador estima que vai encontrar na população com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.
- Erro alfa (α): Erroα (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
- Erro beta (β): Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

4 - Diferença entre duas Médias com Grupos Independentes (teste t)

Utilizado quando se pretende determinar se existe diferença na média de uma caraterística entre duas populações independentes. Por exemplo, determinar se existe diferença de peso entre as populações de homens e mulheres brasileiros. O cálculo pressupõe que o pesquisador utilizará o teste t de Student fazer a comparação. Como todo teste de hipótese o resultado será um valor de “p” que é a probabilidade de se errar ao aceitar a hipótese alternativa (H1), que no caso é a hipótese de que há diferença entre as duas populações.
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Desvio padrão estimado: o desvio padrão que o pesquisador estima que vai encontrar nas populações com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.
- Mínima diferença a ser detectada: É a menor diferença que, se existir entre as populações, o pesquisador deseja provar que as populações são diferentes. Podemos também dizer que é a menor diferença entre as populações que tem alguma relevância clínica.
- Erro alfa (α): Erro α (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
- Erro beta (β): Erro β é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

5 - Diferença entre duas Médias com Grupos Dependentes (teste t pareado)

Utilizado quando se pretende determinar se existe diferença na média de uma caraterística entre duas populações dependentes (pareadas). Por exemplo, determinar se existe diferença de peso na população de homens antes e após um regime de 4 semanas. O cálculo pressupõe que o pesquisador utilizará o teste t pareado para fazer a comparação. Como todo teste de hipótese o resultado será um valor de “p” que é a probabilidade de se errar ao aceitar a hipótese alternativa (H1), que no caso é a hipótese de que há diferença entre as duas populações (a população de medidas antes e a população de medidas depois do regime).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Estimativa do desvio padrão da diferença: o desvio padrão que o pesquisador estima que vai encontrar nas diferenças entre as duas medições. É necessário o desvio padrão da diferença entre os pares de dados. Essa estimativa pode vir da literatura ou de um projeto piloto.
- Mínima diferença a ser detectada: É a menor diferença que, se existir entre as populações, o pesquisador deseja provar que as populações são diferentes. Podemos também dizer que é a menor diferença entre as populações que tem alguma relevância clínica.
- Erro alfa (α): Erroα (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
- Erro beta (β):Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

6 - Correlação entre duas Variáveis (Coeficiente de Correlação de Pearson)

Utilizado quando se pretende determinar se existe correlação entre duas variáveis quantitativas dentro de uma mesma população. Por exemplo, determinar se existe correlação entre o número de vezes que a pessoa escova os dentes por dia e o número de dentes cariados que ele tem. O cálculo pressupõe que o pesquisador utilizará o Coeficiente de Correlação de Pearson para avaliar o grau de correlação entre as duas variáveis. Como todo teste de hipótese o resultado será um valor de “p” que é a probabilidade de se errar ao aceitar a hipótese alternativa (H1), que no caso é a hipótese de que há correlação entre as duas variáveis.
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Coeficiente de correlação: É um valor entre -1 e +1 que corresponde ao menor coeficiente de correlação, que se existir entre as duas variáveis, o pesquisador deseja provar que há correlação entre elas.
- Erro alfa (α): Erro α (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
- Erro beta (β):Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

7 - Estimativa do Odds Ratio (OR)

Odds Ratio pode ser traduzido como Razão de Chance. Pode ser definido como uma razão (divisão) entre a chance de um evento ocorrer em um grupo e o mesmo evento ocorrer em outro grupo. P.ex. Qual o Odds Ratio de ocorrer diabetes entre homes e mulheres. Vamos supor que estudamos 100 homens e 3 deles tinham diabetes e estudamos 100 mulheres 2 delas tinha diabetes. A chance de um homem ter diabetes 3 terem e 97 não, ou seja, 3/97. Já a chance das mulheres foi 2/98. O Odds Ratio é a razão destas duas chances, que é, OR = (3/97) / (2/98) que dá OR = 1,52 e podemos interpretar como sendo que os homens têm 1,52 vezes mais chance de ter diabetes do que as mulheres. Esse cálculo foi feito em uma amostra, mas se queremos determinar o verdadeiro OR numa população calculamos o intervalo de confiança do OR para a população. O resultado será apresentado assim: OR = 1,52 (IC95%: 0,25 – 9,27).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Erro (%): margem de erro máximo que o pesquisador admite na sua estimativa do OR
- Proporção no grupo controle (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo controle com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.
- Proporção no grupo experimental (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo experimental com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

8 - Provar que o Odds Ratio é diferente de 1

Odds Ratio pode ser traduzido como Razão de Chance. Pode ser definido como uma razão (divisão) entre a chance de um evento ocorrer em um grupo e o mesmo evento ocorrer em outro grupo. P.ex. Qual o Odds Ratio de ocorrer diabetes entre homes e mulheres. Vamos supor que estudamos 100 homens e 3 deles tinham diabetes e estudamos 100 mulheres 2 delas tinha diabetes. A chance de um homem ter diabetes 3 terem e 97 não, ou seja, 3/97. Já a chance das mulheres foi 2/98. O Odds Ratio é a razão destas duas chances, que é, OR = (3/97) / (2/98) que dá OR = 1,52 e podemos interpretar como sendo que os homens têm 1,52 vezes mais chance de ter diabetes do que as mulheres. Provar que o OR é diferente de 1 significa provar que a chance de ocorrência do evento em um grupo é diferente da chance no outro grupo.
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Proporção no grupo controle (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo controle com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.
- Proporção no grupo experimental (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo experimental com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.
- K (n exp / n cont): É a proporção do tamanho da amostra que se deseja entre o Grupo Experimental e o Grupo Controle. Um K = 1 significa que o tamanho dos dois grupos serão iguais. K = 2 implica que o tamanho do Grupo Experimental será o dobro do tamanho do Grupo Controle.
- Erro alfa (α): Erroα (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
- Erro beta (β):Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

9 - Estimativa do Risco Relativo (RR)

Risco Relativo (RR) pode ser definido como uma razão (divisão) entre a risco de um evento ocorrer em um grupo e o mesmo evento ocorrer em outro grupo. P.ex. Qual o RR de ocorrer diabetes entre homes e mulheres. Vamos supor que estudamos 100 homens e 3 deles tinham diabetes e estudamos 100 mulheres 2 delas tinha diabetes. O risco de um homem ter diabetes 3 em 100, ou seja 3% Já o risco das mulheres foi de 2%. O RR esses dois riscos, que é, RR = 3% / 2% que dá RR = 1,5 e podemos interpretar como sendo que o risco de um homem ter diabetes é 1,5 vezes o risco das mulheres. Esse cálculo foi feito em uma amostra, mas se queremos determinar o verdadeiro RR numa população calculamos o intervalo de confiança do RR para a população. O resultado será apresentado assim: RR = 1,50 (IC95%: 0,26 – 8,79).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Erro (%): margem de erro máximo que o pesquisador admite na sua estimativa do RR.
- Proporção no grupo controle (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo controle com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.
- Proporção no grupo experimental (%): a proporção (prevalência) que o pesquisador estima que vai encontrar no grupo experimental com a caraterística sendo estudada. Essa estimativa pode vir da literatura ou de um projeto piloto.

10 - Intervalo de Confiança da Sensibilidade

Sensibilidade de um teste diagnóstico é a capacidade do teste de corretamente identificar os “doentes” de uma população. Um teste que tenha sensibilidade de 80% implica que dos “doentes” da população ele corretamente identificaria 80% deles. Para sua determinação é necessário um “padrão ouro” que identifique os verdadeiramente “doentes”. Assim, se em um grupo de 1.000 pessoas 200 são “doentes” e o teste é aplicado nestas 1.000 pessoas e dos 200 “doentes” o teste identifica corretamente como “doentes” 180 deles, o teste apresenta uma sensibilidade de 90%.
Nesse exemplo o cálculo foi feito em uma amostra de 1.000 pessoas, mas se queremos determinar a verdadeira Sensibilidade do teste numa população calculamos o intervalo de confiança da Sensibilidade. O resultado será apresentado assim: Sensibilidade = 90% (IC95%: 86% – 94%).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Sensibilidade Esperada (%): Sensibilidade estimada do teste diagnóstico.
- Prevalência da Doença (%): Prevalência da doença estudada na população.
- Margem de erro (%): margem de erro máximo que o pesquisador admite na sua estimativa de Sensibilidade.

11 - Intervalo de Confiança da Especificidade

Especificidade de um teste diagnóstico é a capacidade do teste de corretamente identificar os “não doentes” de uma população. Um teste que tenha especificidade de 80% implica que dos “não doentes” da população ele corretamente identificaria 80% deles. Para sua determinação é necessário um “padrão ouro” que identifique os verdadeiramente “não doentes”. Assim, se em um grupo de 1.000 pessoas 800 são “não doentes” e o teste é aplicado nestas 1.000 pessoas, e dos 800 “não doentes” o teste identifica corretamente como “não doentes” 720 deles, o teste apresenta uma especificidade de 90%.
Nesse exemplo o cálculo foi feito em uma amostra de 1.000 pessoas, mas se queremos determinar a verdadeira Especificidade do teste numa população calculamos o intervalo de confiança da Especificidade. O resultado será apresentado assim: Especificidade = 90% (IC95%: 86% – 94%).
Para calcular o tamanho da amostra são necessárias as seguintes informações.
- Especificidade Esperada (%): Especificidade estimada do teste diagnóstico.
- Prevalência da Doença (%): Prevalência da doença estudada na população.
- Margem de erro (%): margem de erro máximo que o pesquisador admite na sua estimativa de Especificidade.

12 - Diferença entre mais de duas Médias de Grupos Independentes (Análise de Variância)

Utilizado quando se pretende determinar se existe diferença na média de uma caraterística entre mais duas populações independentes. Por exemplo, determinar se existe diferença de peso entre as populações de adultos brasileiros, adultos argentinos e adultos uruguaios. O cálculo pressupõe que o pesquisador utilizará Análise de Variância para fazer a comparação. Como todo teste de hipótese o resultado será um valor de “p” que é a probabilidade de se errar ao aceitar a hipótese alternativa (H1), que no caso é a hipótese de que há diferença entre pelo menos duas das populações.
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Número de grupos: número de populações sendo comparadas.
- Desvio padrão estimado: o desvio padrão que o pesquisador estima que vai encontrar nas populações com a caraterística sendo estudada. É uma estimativa do desvio padrão dentro de cada população e não entre as populações todas. Essa estimativa pode vir da literatura ou de um projeto piloto.
- Mínima diferença a ser detectada: É a menor diferença que, se existir entre pelo menos duas populações, o pesquisador deseja provar que as populações são diferentes. Podemos também dizer que é a menor diferença entre as populações que tem alguma relevância clínica.
- Erro alfa (α): Erroα (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
- Erro beta (β): Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.

13 - Análise de Regressão Logística Múltipla

Análise de regressão logística múltipla tem por objetivo determinar um modelo matemático que permita predizer o valor de uma variável dependente binária (casos positivos e negativos) em função de um conjunto de variáveis independentes (também chamadas de variáveis preditoras ou explicativas).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Número de Variáveis Independentes: É número de variáveis independentes (preditoras) que serão medidas em cada elemento da pesquisa.
- Menor Proporção Esperada (%): é menor proporção, em %, da ocorrência de casos positivos ou negativos da variável dependente estudada.

14 - Análise de Regressão Linear Múltipla

Análise de regressão linear múltipla tem por objetivo determinar um modelo matemático que permita predizer o valor de uma variável dependente quantitativa em função de um conjunto de variáveis independentes (também chamadas de variáveis preditoras ou explicativas).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Número de Variáveis Independentes: É número de variáveis independentes (preditoras) que serão medidas em cada elemento da pesquisa.

15 - Análise de Sobrevida

Análise de sobrevida é um conjunto de técnicas estatísticas para determinar o tempo até que um evento ocorra. Por exemplo determinar o tempo médio de sobrevida após a pessoa ter sido diagnosticada com uma doença grave. Além disso outras questões podem ser respondidas como, por exemplo, após 5 anos do diagnóstico qual a porcentagem esperada de doentes que sobreviverão. No cálculo proposto o tamanho da amostra é calculado para se fazer a comparação da sobrevida entre dois grupos que são chamados de Grupo Experimental (GE) e Grupo Controle (GC).
Para calcular o tamanho da amostra são necessárias as seguintes informações:
- Erro alfa (α): Erroα (Nível de significância) é a probabilidade de se estar errado ao aceitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Em biologia o mais usual é utilizar 5% (0,05), embora possa se atribuir qualquer outro valor.
- Erro beta (β): Erroβ é a probabilidade de se estar errado ao se rejeitar a Hipótese Alternativa (H1) quando se utiliza um teste de hipótese na análise dos dados. Está diretamente relacionado com o Poder da amostra de corretamente aceitar H1 quando essa é verdadeira. (Poder = 1-Erro β). Em biologia o mais usual é utilizar 20% de Erro β, que é a mesma coisa que dizer que queremos Poder=80%.
- Proporção GE e proporção GC: É a relação do tamanho da amostra que se deseja entre o Grupo Experimental e o Grupo Controle. Se Proporção GE = 1 e Proporção GC = 1 isso significa que o tamanho dos dois grupos serão iguais. Se Proporção GE = 2 e Proporção GC = 1 isso significa que o tamanho do Grupo Experimental será o dobro do Grupo Controle.
- Risco Esperado GE: É o risco que se espera do evento ocorrer no GE no período avaliado.
- Risco Esperado GC: É o risco que se espera do evento ocorrer no GC no período avaliado.

Entre em contato

Endereço de e-mail para contato e dúvidas: calculo.amostral@gmail.com