Dados e Análise

Para qualquer estudo, a obtenção de dados é uma etapa fundamental. Sendo inviável a coleta de dados diretamente em hospitais da rede pública, optamos por utilizar dados oriundos do Datasus, que é o órgão responsável pela criação e administração do banco de dados que contém informações importantes acerca da saúde em nosso país. Consideramos esta a opção mais viável e confiável para nosso estudo.
Primeiro, vamos observar a taxa de prevalência de diabetes mellitus para as capitais da região Sudeste. Esta taxa é o percentual de adultos (35 anos ou mais) que referiram ter diabetes.


Aqui já temos um problema bem comum ao se coletar dados: estes são oriundos de pessoas que referiram ter diabetes. Temos que contar com a seriedade e sinceridade do indivíduo questionado e não temos acesso aos dados de centenas ou milhares de pessoas que podem ser diabéticas e sequer sabem disso.
Outro detalhe que podemos observar é a flutuação dos valores. Não é uma flutuação grande, mas ainda assim existe. Deve-se principalmente à variação no tamanho da população como um todo. O crescimento de uma população é algo que até podemos estimar estatisticamente, porém, não podemos controlar, tampouco o surgimento de novos casos de diabetes, sendo assim, embora sempre possamos utilizar a estatística para estimar acontecimentos futuros, não podemos esquecer de outros fatores alheios ao nosso estudo que podem alterar os dados.
Podemos nos questionar se o passar dos anos (de 2006 a 2008) tem algum tipo de relação com a incidência de diabetes nas capitais escolhidas para este estudo. Podemos verificar se estes dados estão, de alguma maneira, correlacionados. Uma ferramenta para esta finalidade é o teste do Qui-Quadrado no qual efetuamos cálculos para obter o parâmetro X² (qui-quadrado propriamente dito) e o parâmetro g.l. (graus de liberdade) que é dado por: g.l. = (linhas da tabela - 1) x (colunas da tabela - 1). De posse de X² e g.l. calculados, utilizamos uma tabela com valores de qui-quadrado separados pelo g.l. e também para diversas faixas de precisão. Em nosso estudo, utilizaremos 95% de precisão.
A tabela com valores de qui-quadrado pode ser encontrada em livros de estatística ou até mesmo online. Iremos utilizar a tabela disponível aqui.

Passo 1 - Estabelecer as hipóteses. H0: Há correlação entre as variáveis. H1: Não há correlação.
Passo 2 - Cálculo de número de graus de liberdade: g.l. = (3-1)x(4-1) = 6. 
Passo 3 - Obtenção das frequências observadas através da tabela propriamente dita. Cada célula da tabela é a frequência observada em questão, que chamaremos de Oij onde i é a linha e j é a coluna. 
Passo 4 - Obtenção das frequências esperadas também através da tabela, porém, utilizeramos a seguinte fórmula: Eij = (ni x nj) / n onde ni é o total da linha, nj é o total da coluna e n é o total geral. Para a execução deste passo, precisamos dos totais da tabela, já mostrados na figura abaixo.


Passo 5 - De posse dos totais da tabela, das frequências obtidas e esperadas, calculamos o X² que é o somatório de cada frequência obtida menos a esperada ao quadrado sobre a frequência esperada.  
Através de cálculos realizados utilizando o Excel, pudemos obter um valor de X² = 0,717. O X² tabelado é 11,07, ou seja, é maior que o obtido, então H0 é válida. Ou seja, existe uma correlação entre a prevalência de diabetes mellitus nas capitais avaliadas nos anos de 2006 a 2008.