Baixe Texto Introdutório de Epidemiologia e outras Notas de estudo em PDF para Epidemiologia, somente na Docsity! Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Texto introdutório de Epidemiologia AUTORIA: MAURÍCIO DE ANDRADE PÉREZ Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Introdução Oobjetivo deste texto é o de iniciar no estudo da epidemiologia, estudantes da área de saúde pública. A Epidemiologia pode ser definida, de forma bastante preliminar, como a disciplina que estuda os determinantes do processo saúde-doença nas populações. Ao se iniciar qualquer investigação acerca do processo saúde-doença, algumas perguntas fundamentais devem ser formuladas, no intuito de descrever e mesmo comparar grupos ou subgrupos populacionais em relação a distribuição de doenças (morbidade) ou óbitos (mortalidade). Estas perguntas, que podem variar num espectro relativamente amplo (pois dependerão da natureza da doença (infecciosa, ambiental, profissional, etc. - estudada), abrangem questões acerca das pessoas afetadas (sexo, idade, profissão, saneamento, alimentação, hábitos culturais, etc.), ao lugar (local de nascimento, distribuição aleatória da doença ou conforme algum padrão determinado - como estradas, rios etc.) e finalmente ao tempo segundo o quala doença se distribui (a patologia estudada possui uma tendência de aumentar ou diminuir ao longo das décadas ? esta ocorreria segundo algum padrão cíclico, se repetindo ao longo de alguma estação do ano ? a doença é nova ou antiga na região ? Os casos apareceram repentinamente num curso de horas ou dias, ou segundo uma distribuição mais lenta ?). Tais fatores são abordados em inúmeros livros de epidemiologia, como Pessoa, Lugar e Tempo e serão vistos com mais detalhes a seguir. Pessoa Idade - Sem sombra de dúvida, uma das mais importantes variáveis em epidemiologia, sendo levada em consideração na construção de inúmeros indicadores (ver adiante). Sua apresentação pode ser feita a partir das medidas de tendência central (média, mediana, moda, desvio padrão)! ou ainda sob a forma tabular, segundo as faixas etárias de importância para a doença em questão. Na tabela I por exemplo, podemos apreciar a distribuição dos casos acumulados de SIDA (Síndrome da Imunodeficiência Adquirida) no Brasil, durante o período compreendido entre 1980 e 1996 (08/96). A construção das faixas etárias neste caso, que não necessita sempre seguir este padrão, obedece à divisão utilizada pela OMS (Organização Mundial de Saúde) e outros organismos internacionais, e que consiste em dividir os casos (incidência, mortalidade etc.) da doença em períodos de 5 anos, acrescida de um maior detalhamento nas idades entre 9 a 14 anos. A vantagem do método adotado pela OMS, advém do fato de que ele permite ao leitor reagrupar os casos (com certa limitação), segundo seu interesse, ao mesmo tempo em que fornece algum grau de visualização dos dados. Repare que no caso da SIDA, o grupo mais afetado está compreendido entre os 15 e 49 anos de idade, o que está de acordo com as distribuições clássicas de doenças sexualmente transmissíveis (DST). * Ver adiante AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 2 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Homossexuais masculinos - Desde a notificação do primeiro caso de SIDA ocorrido no Brasil em 1980, a maioria dos doentes registrados encontra-se neste grupo (tabelas II e II). Campanhas direcionadas a este subgrupo populacional tem tido bastante êxito em algumas cidades (São Francisco inicialmente),e países EUA, França etc., onde a incidência de doenças venéreas particularmente neste subgrupo populacional tem apresentado significativa queda ao longo dos anos. Acreditamos hoje que a transmissão de SIDA em São Francisco, para este grupo seguiu um comportamento semelhante (queda da incidência) já que a prevenção das DST reflete indiretamente uma maior prevenção da SIDA. É importante ter em mente que o grupo denominado “homossexuais masculinos” podem ser subdivididos em inúmeras outras categorias, representando o número de parceiros/ano ou o tipo de prática sexual ou ainda o número de relações com cada parceiro ao longo do tempo. Todos estes dados podem ser de fundamental importância quando o epidemiologista passa da descrição pura e simples dos dados para a tentativa de formular um modelo que possa explicar a dinâmica de transmissão da SIDA. Bissexuais - os bissexuais vem acrescentar ao menos teoricamente uma ponte entre os homo e os heterossexuais. A relativa importância dos bissexuais entre o total de casos notificados no Brasil, deve entretanto ser vista com cautela, uma vez que a resposta do entrevistado, a uma classificação como esta, passa por critérios subjetivos e culturais que podem facilmente superestimar este grupo em nosso país. Heterossexuais - Desde o momento em que o vírus da imunodeficiência adquirida foi isolado do sêmen e secreções vaginais, tornou-se evidente que esta forma de transmissão, apesar de estar concentrada no chamado “padrão africano”, era um fato inegável para o Brasil e outros países que não apresentavam tal padrão. O longo período de latência do HIV, associado com uma certa deficiência na vigilância, notificação e diagnóstico dos casos de SIDA, apesar de comprometer um pouco a correta visualização da epidemia, nos mostra uma inegável tendência (tabelas II e III) de crescimento da epidemia neste subgrupo. . Este é um fato particularmente grave em populações adolescentes, onde se torna urgente a necessidade frequente e repetitiva de campanhas de conscientização sobre os riscos de contaminação do HIV. Transmissão sangiíínea - Os dados sobre a transmissão sangiiínea no Brasil, ainda estão envoltos em uma grande polêmica. Se por um lado tem havido um grande esforço por parte das secretarias de saúde , no que toca ao controle dos bancos de sangue e hemoderivados, em contrapartida sabe-se de deficiências neste controle, especialmente fora dos grandes centros. Para complicar ainda mais a questão, o longo período de incubação do HIV, faz com que hoje estejamos analisando uma situação ocorrida 7 ou 8 anos atrás (pois a notificação , baseada nos casos de SIDA e não nos infectados). Levando-se em consideração todos os pontos discutidos acima, podemos dizer que hoje, a transmissão por via sangiiínea está controlada (tabelas II e III). Os casos que ainda são registrados devem-se a falhas no teste em detectar o vírus em doadores de sangue. Apesar destas falhas serem raras (devido ao alto poder de sensibilidade, ou seja, capacidade de detecção do vírus) dos testes hoje utilizados, nenhum teste é 100% “confiável”, daí a existência de erros, em pequena proporção, mas sempre presentes. Este fenômeno é mundial, sendo que as melhores políticas de combater esta situação já foram tomadas há alguns anos (eliminação de doadores remunerados, obrigatoriedade de testar todas as doações, abertura de centrais de testagem anônima para o HIV). Transmissão perinatal - A transmissão perinatal (ver indicadores mais adiante), envolve a infecção pelo vírus através de uma transmissão denominada de vertical (da mãe para o filho) ainda durante a vida intra-uterina ou durante o parto. A incidência neste grupo vem aumentando consideravelmente no Brasil e em outros países, como reflexo direto do aumento da incidência de SIDA em mulheres em idade fértil. O mais absurdo entretanto é o fato de hoje dispormos de drogas capazes de reduzir esta taxa de transmissão dos 30-40% ocorridos naturalmente para algo em torno de 4%, desde que a gestante saiba que é infectada, e portanto esteja apta a ser tratada. Surpreendentemente, no mundo real uma grande parcela destas gestantes não sabiam que estavam contaminadas (um fenômeno mundial), uma vez que desconheciam o comportamento de risco de seu parceiro AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 5 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Tabela II Distribuição dos casos de SIDA segundo ano de diagnóstico, faixa etária e razão por sexo - Brasil, 1980-1996 Ano Número de casos Menores de 13 anos 13 a 49 anos Maiores de 50 anos Masc. Fem. Razão Masc. Fem. Razão Masc. Fem. Razão 1980 - - - 1 - - - - - 1981 - - - - - - - - - 1982 - - - 9 - - - - - 1983 1 - - 36 1 36 3 - - 1984 9 1 91 18 4 30 12 - - 1985 15 3 5a 454 14 32 36 1 36 1986 24 9 3 917 51 18 so 5 16 1987 74 22 3 1951 205 10 168 4 8 1988 82 67 11 3241 412 8 248 33 8 1989 14 65 21 4394 555 8 350 n 5 1990 159 12 11 6044 849 7 464 60 8 1991 169 144 11 7840 1433 5 563 103 5 1992 187 153 11 9454 2080 5 685 153 4 1993 215 201 11 10308 2720 4 754 203 4 1994 261 237 11 10254 2824 4 756 214 4 1995 180 210 11 8314 2643 3 637 204 3 1996 23 4 11 1189 437 3 97 29 3 Total 1513 1245 11 64524 14228 5 4853 1097 4 (*) 1996 - Dados preliminares até semana 35, terminada em 31/08). Fonte: Boletim epidemiológico PNDST/Ministério da Saúde AUTORIA: MAURÍCIO DE ANDRADE PÉREZ Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Tabela HI: Distribuição dos casos de SIDA segundo ano de diagnóstico, faixa etária e razão por sexo - Brasil, 1980-1996 Período de diagnóstico Categoria de exposição Ano Sexo Sexual Sangiúínea Perinatal Tenorado 1980 Masc. 1 - - - Fem. - - - - 1981 Masc. - - - - Fem. - - - - 1982 Masc. 8 1 - - Fem. - - - - 1983 31 4 - 5 Fem. - - - 1 1984 Masc. no 13 - 16 Fem. 1 2 - 2 1985 Masc. 419 s4 1 46 Fem 6 7 - 5 1986 Masc. 800 123 4 116 Fem. 13 38 3 13 1987 Masc. 1514 424 19 317 Fem. 36 155 u 48 1988 Masc. 2197 792 29 620 Fem. 78 293 43 104 1989 Masc. 2844 1145 so 865 Fem. 151 314 st 183 1990 Masc. 3427 1803 94 1425 Fem. 242 380 81 330 1991 Masc. 4490 2422 12 1656 Fem. 462 593 12 540 1992 5652 2820 142 1775 Fem. 1021 753 126 502 1993 Masc. 6073 38 173 1945 Fem. 1548 843 174 564 1994 Masc. c28s 2546 2s 2238 Fem. 1684 643 23 735 1995 Masc. 4842 2415 158 1731 Fem. 1586 607 177 689 1996 Masc. 761 306 18 27 Fem. 293 86 7 489 (*) 1996 - Dados preliminares até semana 35, terminada em 31/08). Fonte: Boletim epidemiológico PNDST/Ministério da Saúde AUTORIA: MAURÍCIO DE ANDRADE PÉREZ Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia incubação, ou seja, o tempo médio necessário para que um infectado se torne clinicamente doente, situa- se hoje ao redor de 13 anos). A interpretação desta curva apresenta uma considerável dificuldade, visto os inúmeros componentes que dela participam, tais como a proporção de relações sexuais que cada um dos grupos (homossexuais/bissexuais, heterossexuais, usuários de drogas, etc.) trocam entre si, O número médio de parceiros/ano bem como o número médio de relações com cada parceiro, o tamanho proporcional de cada um destes | grupos com comportamento de risco em relação a população total, o tempo médio para que um paciente infectado se torne infectante (e ainda — de forma complementar, se esta capacidade de ser infectante é constante ou não ao longo do período de incubação, etc.). Todos estes fatores não são exclusividade da SIDA; doenças como a malária, sarampo, poliomielite, câncer, violência, enfim, todas as doenças possuem inúmeros itens que devem ser levados em conta, quando deparamos com a tentativa de estimar o que deverá ocorrer no futuro. Em alguns momentos, como no caso da SIDA, o contato íntimo (através do sexo ou por transfusões) apresenta um aspecto importante na epidemiologia. No caso da esquistossomose, temos a entrada de um hospedeiro intermediário, o que acrescenta a altemativa de combatê-lo para se tentar controlar a doença. Apesar de inúmeros programas para erradicação ou controle da esquistossomose centrarem no vetor é, interessante observar que o único país a erradicar esta endemia foi o Japão que investiu pesadamente em saneamento básico. Dentre as doenças infecciosas existentes, a única erradicada mundialmente foi a varíola o que a torna um importante exemplo de como a dinâmica de uma doença transmissível, uma vez compreendida, facilita a projeção para outras patologias. Um dos fatores que mais ajudava a perpetuação do vírus da varíola era sua alta infectividade. Inúmeras outras circunstâncias facilitaram a sua erradicação, como por exemplo a existência de uma vacina altamente eficaz, o fato de que um infectado ou vacinado adquiria imunidade permanente, a inexistência de outro hospedeiro que não o homem, e finalmente a distribuição temporal da doença que era lenta o suficiente para permitir a vacinação de bloqueio, uma vez que um caso houvesse sido diagnosticado. Atualmente duas doenças apresentam reais possibilidades de erradicação poliomielite e sarampo. No caso da | pólio (atualmente erradicada do Brasil e da maior parte dos países das Américas), a estratégia brasileira consistiu na eliminação sistemática | dos suscetíveis, através de grandes campanhas de vacinação em massa. Estas campanhas não só visavam a imunização, como também se baseavam na constante substituição do vírus selvagem pelo vacinal no meio ambiente. Sarampo, possui um comportamento bastante semelhante à varíola, entretanto sua maior capacidade em se propagar rapidamente, complica bastante as estratégias de erradicação. Por outro lado, as sucessivas campanhas de vacinação apesar de terem sido capazes de reduzir bastante o número de casos da doença, criaram um problema adicional que é o de acumular na idade adulta um contigente cada vez maior de suscetíveis ao sarampo. Distribuição de casos e incidência de SIDA segundo ano de diagnóstico, Brasil, 1980-1996. Milhares 10 16 8 14 12 6 10 4 8 8 2 4 2 o o 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 10 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Coefi Pode-se entender a idéia básica dos coeficientes ou taxas na saúde, se levarmos em conta que sua principal função é a de resumir, em alguns poucos números, uma série de dados que de outra forma se tornariam confusos e de difícil interpretação. Se utilizarmos o número de casos de uma determinada doença, para se formar uma idéia do risco de se adoecer, estaremos muito provavelmente formulando conclusões equivocadas, pois este número de casos dever ser relativizado em função do número de pessoas existentes na referida população, ou — ainda, ao número de pessoas em risco de adoecer, para a doença analisada. ientes e taxas utilizados em epidemiologia Imagine por exemplo duas cidades Ae B, onde ocorreram respectivamente 10 e 100 casos de uma dada doença no ano de 1991. A primeira vista, B parece ter uma situação menos controlada para a doença em questão. Se relativizarmos as duas cidades em função de suas respectivas populações (100 pessoas na cidade A e 100.000 em B) esta impressão inicial se mostrará completamente infundada, visto que 10/100 representa que nesta cidade, ocorreu ao longo de 1991, 10 casosem cada 100 habitantes, enquanto que em B, teremos 100/100.000 ou seja 1 caso para cada 10.000 habitantes (um número cem vezes menor). Podemos a grosso modo dizer que os indicadores nos fornecem uma idéia de probabilidade (ou melhor dizendo, uma velocidade média de transformação de uma pessoa sadia ou viva numa doente ou morta). AUTORIA: MAURÍCIO DE ANDRADE PÉREZ nu Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Tabela V Coeficientes de incidência acumulada da AIDS (por 100.000 habitantes), segundo ordem de incidência, Maio 1989 Posto Global África Américas Europa Oceania Ásia 1 Bermuda (1731 2 Guiana Franc. (148) 3 Bahamas (110) 4 Congo (57) 5 Uganda (44) 6 Eua (38) 7 Malawi (35.5) 8 Haiti (33.4) 9 Burundi (28.2) 10 Barbados (27.6) 1 Tin. Tobago (27.5) 12 Guadalupe (25.7) 13 R.Centro Afr. (23.9) 14 Ruanda (20.1) 15 Zâmbia (18.2) 16 Tanzânia (17.9) 17 Martinica (14) S.V.Granadina(12) 18 19 Quênia (12.4) 20 R.Dominicana (12) 2 Suíça (12.2) 22 França (11.5) 23 Granada (10.6) 24 Canadá (9.5) AUTORIA: MAURÍCIO DE ANDRADE PÉREZ Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia hoje um quadro bastante real). Numa situação como esta, onde teremos um tratamento, mas não a cura, haverá progressivamente um acúmulo de casos (já que os infectados morrerão segundo seu tempo biológico normal), ou seja, um aumento na prevalência. Podemos entretanto esperar, após algum tempo, um grande incremento na incidência por 2 mecanismos : grande aumento dos infectados (aumento da prevalência - já que a doença deixou de ser letal, sem entretanto existir uma cura) levando a uma probabilidade destes casos infectarem outras pessoas e uma certa negligência pelos cuidados em relação às medidas de proteção das doenças venéreas (já que a SIDA deixou de ser letal). A questão levantada acima está muito longe de ser puramente teórica já que inúmeros exemplos dos efeitos da introdução de uma cura ou tratamento existem na literatura médica. A criação de um tratamento para a sífilis na década de 40, modificou rapidamente o seu perfil de letalidade. Pessoas que antes morriam após alguns anos de infecção passaram a se curar de uma forma eficiente, rápida e barata. A conseqiiência ficou muito longe da erradicação da sífilis, muito pelo contrário, pois uma vez não sendo mais letal, foi uma das características que facilitaram a revolução sexual dos anos 60 e 70. O próprio S. aureus que sempre foi responsabilizado por quadros infecciosos graves, foi inicialmente controlado na década de 40, para ressurgir nos anos 80/90 com uma forma multiresistente (MARSA). A questão básica é que devemos analisar com o cuidado as alterações no perfil de mortalidade e morbidade, decorrentes de alterações significativas do tratamento, das mudanças observadas que seriam na verdade, oriundas simplesmente de um — diagnóstico mais precoce (sem qualquer interferência do tratamento proposto). Os indicadores de mortalidade (listados abaixo), seguem os mesmos princípios básicos já descritos para a morbidade. Nos paísesem — desenvolvimento, tais como o Brasil, a notificação compulsória de | doenças possui, salvo raras exceções, uma grande lacuna de informação devido a inúmeros fatores, tais como a falta de visão comunitária dos | médicos que atuam na ponta do sistema de saúde (o que faz com que os mesmos não notifiquem doenças ao estado), a lentidão com que o estado processa e retorna a informação para os profissionais de saúde, etc. Reconhece-se uma certa incoerência ao se trabalhar ou estimar a saúde de uma população, a partir dos dados de mortalidade; entretanto | óbito, por possuir a propriedade de ser um evento único e importante em qualquer sociedade, possui um registro muito mais fidedigno, permitindo conclusões muito mais próximas a realidade do que as que poderíamos chegar baseados apenas na morbidade notificada. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 15 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Figura la (doença crônica) JULHO AUTORIA: MAURÍCIO DE ANDRADE PÉREZ AGOSTO SETEMBRO Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Figuralb (doença aguda) JULHO AGOSTO SETEMBRO Como já foi dito acima, o princípio básico dos coeficientes são semelhantes aos discutidos no item referente a morbidade. O evento de interesse (Óbito com ou sem algum atributo populacional, tais como sexo, faixa etária etc.) é contraposto ao número de pessoas existentes naquela população (ou algum subgrupo populacional semelhante ao usado no numerador). Os principais coeficientes de mortalidade são : a) Mortalidade geral : Este índice, apesar de ser bastante simples e bastante utilizado, deve ser visto sempre com muita cautela. Repare que o numerador, ao relacionar todos os óbitos ocorridos numa determinada comunidade, não está levando em conta as peculiaridades que esta comunidade possa vir a ter, em relação a inúmeros fatores, tais como composição etária por exemplo. Da mesma forma que o PIB (total da renda produzida por uma nação, dividida pelo número de habitantes da mesma) não indica em absoluto o nível de vida de uma comunidade (veja o caso brasileiro cujo PIB situa o Brasil entre as 10 maiores economias mundiais), a mortalidade geral sofre de um problema semelhante. Se compararmos a mortalidade geral do Brasil com a da Suécia, veremos valores equivalentes a 10,3 e 10,5 óbitos por AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 17 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia tempo em que o óbito ocorreu. Os principais coeficientes assim obtidos (ver abaixo), denominam-se Mortalidade infantil tardia, neonatal (ou precoce) e perinatal. Mortalidade Infantil Tardia : Relaciona o número de óbitos em crianças maiores de 28 dias e menores de 1 ano, durante 1 ano, numa área considerada, dividido pelo n.º de nascidos vivos na mesma região e tempo. Repare que ao considerar apenas os óbitos nesta faixa etária, o impacto do meio ambiente neste indicador será extremamente forte, isto é, estas crianças formam um grupo de sobreviventes das doenças genéticas, má atenção à gestação (toxemia gravídica), má assistência hospitalar (sofrimento fetal, tétano neonatal). Um óbito no período de tempo considerado por este indicador, reflete exatamente uma falha completa no sistema de saúde pública da região considerada, fato este que pode ser prontamente revertido (com imenso impacto na mortalidade infantil como um todo), caso apliquem-se campanhas de vacinação eficazes, invista-se minimamente numa rede de saneamento básico, etc. Tal fato vêm ocorrendo em inúmeras cidades brasileiras (RJ por exemplo) onde a mortalidade infantil está situada ao redor de 35 óbitos para cada 1000 nascidos vivos, as | custas de uma maior atenção nas campanhas de vacinação (poliomielite foi erradicada, sarampo e difteria apresentam pouquíssimos casos), um — pequeno investimento em saneamento básico nas favelas etc. Um dos grandes avanços da medicina durante os anos 70 foi exatamente o de desenvolver tecnologias de baixíssimo custo, com grande impacto nesta fase da vida (readaptação oral, diagnóstico e tratamento precoce das infecções respiratórias agudas, acompanhamento do peso e altura das crianças na puericultura etc. Podemos dizer que uma mortalidade tardia maior de 50 por 1000 nascidos vivos, representa hoje, para qualquer sociedade do planeta, um vergonhoso e criminal descaso pela vida humana. Para se ter apenas uma idéia, a OMS calcula que todas as crianças do planeta poderiam ser vacinadas (seguindo completamente o calendário proposto pelos organismos internacionais), com o que os países gastam em apenas um dia com material bélico. Mortalidade Infantil neonatal (precoce) : Este coeficiente estabelece a relação entre o número de óbitos em crianças menores de 28 dias, numa determinada área e tempo, pelo total de nascidos vivos na mesma área e ano. Aqui o meio ambiente não atua de forma tão pesada quanto no último indicador, entretanto ele sofre uma séria influência de três fatores absolutamente distintos, quais sejam : Crianças que morrem por um mal atendimento hospitalar (tétano, segiielas do parto, etc.) óbitos decorrentes de doenças contra as quais a medicina não consegue ainda lidar (anencefalia por exemplo) . Crianças que faleceram pela incapacidade de diagnosticar precocemente, deficiências maternas ou infantis contra as quais a medicina possui métodos eficazes e efetivos para uma razoável intervenção. Desta maneira, este indicador poderá ser ainda mais refinado se separarmos ao menos uma parte das causas responsáveis pelos 3 itens acima. Mortalidade Perinatal : definida como a relação entre o número de crianças falecidas entre a 28º semana de gestação e a 1º semana de vida, para uma época e locais definidos, segundo o número de nascidos vivos, somados aos óbitos fetais tardios. Altos níveis de mortalidade perinatal certamente não se relacionam com doenças complicadas ou raras e sim a um despreparo das unidades de atenção médica. No Brasil, a principal mortalidade registrada há alguns anos, nas grandes capitais, deve-se ao componente perinatal. Na verdade, observa-se para todo o país, um crescimento proporcional deste grupo, em detrimento da mortalidade infantil tardia, o que denota a falência do sistema de atendimento médico-hospitalar, resultante de anos de completo descaso dos diversos setores estatais de gerenciamento deste sistema. Imaginemos uma situação simplificada da realidade, onde a mortalidade infantil esteja situada ao redor de 200 óbitos para cada 1000 nascidos vivos. Se houver uma decisão política (no Brasil gasta-se cerca de US$ 40,00 por habitante/ano em saúde, alguns países Africanos aproximadamente US 4,00 e finalmente os países desenvolvidos algo entre U$700,00 a U$2500) de se investir na vacinação em AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 20 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia massa, saneamento, incentivo ao aleitamento materno, rehidratação oral etc., esperaríamos um grande decréscimo na mortalidade infantil, devido principalmente ao seu componente infantil tardio, já que haveria um grande impacto nos óbitos entre o 1º mês eo 1º ano de vida (que não por acaso explica o “milagre” de algumas administrações do nordeste). Digamos que após algum tempo de implementação desta política, a mortalidade infantil caísse para algo em torno de 45 óbitos para cada 1000 nascidos vivos; continuando nosso exemplo, este país aumenta os recursos destinados à saúde, implementando um melhor atendimento perinatal (diagnóstico precoce e correto acompanhamento da toxemia gravídica, suplementação alimentar para mães desnutridas, vacinação antitetânica das gestantes, etc.). A nova queda a ser observada nos óbitos dever-se-á ao componente perinatal (observa-se que na população branca americana, a mortalidade infantil está situada em torno dos 8 a 11 óbitos por 1000 nascidos. vivos, enquanto que na população negra e hispânica algo próximo a 17-20 óbitos por 1000 nascidos vivos: na população branca da África do Sul durante o regime do Apartheid tínhamos 10-13 óbitos por 1000 nascidos vivos enquanto que entre os negros este número subia para 40/1000). Letalidade A taxa de letalidade é definida como o total de óbitos por determinada doença, dividido pelo total de casos da mesma doença; esta taxa expressa a gravidade com que um agente etiológico se manifesta numa dada população, num determinado momento do tempo. A letalidade pode ser influenciada por uma real queda no aparecimento de manifestações graves (como por exemplo a escarlatina no século passado, quando comparada aos nossos dias), a descoberta de uma cura ou tratamento (sífilis e diabetes respectivamente) ou ainda ao aumento no número de diagnósticos realizados. Quanto a este último item, vejamos a distribuição da letalidade para a SIDA no Brasil (tabela VD. Pode-se ver claramente que a letalidade vem caindo progressivamente de 1980 à 1996. Se partirmos do princípio de que uma cura ou tratamento realmente | eficazes não estão ainda disponíveis, podemos inferir algumas das razões pelas quais esta “queda” da letalidade vem se processando : a) aumento do número de diagnósticos consegiientes a uma real progressão da epidemia. Neste caso, ao se obter um aumento no denominador de uma forma mais “acelerada” do que no numerador, a conseqiiência será a “queda” na letalidade. b)O fato da SIDA ser uma doença de evolução lenta, acarreta que os óbitos que ocorrem hoje, pertencem a pessoas infectadas com anos de antecedência, ou seja, numa epidemia em ascensão deveríamos esperar uma certa “queda” na letalidade. c) Finalmente, sabemos que apesar de que uma cura ou tratamento que controle a doença, não terem ainda sido criados (a estimativa para o desenvolvimento de uma vacina razoavelmente eficaz, situa- se ao redor do ano 2002 - o tratamento está ainda sem previsão) é, inegável que o manuseio clínico dos pacientes de SIDA vem se aprimorando nos últimos anos (tratamento profilático para Pneumocysti carinii, diagnóstico mais rápido da Citomegalovirose, Toxoplasmose, coquetel de drogas antiretrovirais etc.), aumentando-se a sobrevida, ou em outras palavras, diminuindo a letalidade (tabela VI e gráfico II). Como foi visto em alguns tópicos anteriores, a epidemiologia necessita, em determinados momentos, comparar 2 ou mais populações, em relação a uma série de atributos. Nestes casos, um erro que pode ser facilmente cometido é o de comparar grupos com estruturas demográficas distintas, ou AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 24 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Tabela VI Distribuição dos casos de AIDS, óbitos conhecidos por ano de diagnóstico e letalidade, Brasil, 1980-1996 Ano de diagnóstico Casos Obitos Letalidade 1980 1 1 100.0 1981 - - - 1982 9 5 55.6 1983 4 37 90.2 1984 144 117 81.3 1985 538 416 77.3 1986 no 807 72.1 1987 2524 1797 71.2 1988 4156 2990 71.9 1989 5613 3821 68.1 1990 7782 5050 64.9 1991 10387 5999 57.8 1992 12791 6524 51.0 1993 14438 6737 46.7 1994 14559 5503 37.8 1995 12205 3561 29.2 1996 1801 379 21.0 Total 88099 43744 49.7 (*) 1996 - Dados preliminares até semana 35, terminada em 31/08). Fonte: Boletim epidemiológico PNDST/Ministério da Saúde Gráfico II - Letalidade da AIDS, - * 1980-1996 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 Ane de diagnostico ainda como será visto mais adiante, grupos com composição diferente de risco. Um dos métodos utilizados chama-se “método direto de padronização”. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 22 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia simples da idade. Por outro lado, observa-se também que a distribuição é razoavelmente uniforme, ao contrário do observado na tabela 1. Desta forma, não seria surpreendente se encontrarmos uma média etária, ao redor dos 30 anos. Gráficos Os gráficos em barra (gráfico 1) são ideais para dados nominais ou ordinais (principalmente quando envolvem 5 ou mais categorias). TABELA | - NÚMERO DE LESÕES MUCOSAS, EM PACIENTES COM LEISHMANIOSE TEGUMENTAR, INTERNADOS NO HEC, 1976-1996 Valid Cumulative Frequency | Percent | Percent Percent Valid ,00 58 8,3 83 8,3 1,00 417 59,7 59,7 68,0 2,00 106 15,2 15,2 83,1 3,00 61 8,7 8,7 91,8 4,00 20 2,9 2,9 94,7 5,00 9 1,3 1,3 96,0 6,00 7 1,0 1,0 97,0 7,00 6 9 9 97,9 8,00 3 4 4 98,3 9,00 1 1 1 98,4 10,00 3 4 4 98,9 11,00 1 1 1 99,0 16,00 1 1 1 99,1 21,00 2 :3 3 99,4 25,00 1 1 1 99,6 26,00 1 1 1 99,7 30,00 1 1 1 99,9 35,00 1 1 1 100,0 Total 699 100,0 100,0 Total 699 100,0 AUTORIA: MAURÍCIO DE ANDRADE PÉREZ Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia TABELA Il - FAIXA ETÁRIA DOS PACIENTES COM LEISHMANIOSE TEGUMENTAR, ATENDIDOS NO HEC, 1976-1996 Valid Cumulative Frequency | Percent | Percent Percent Valid 0-9,9 84 12,0 12,0 12,0 10-19,9 135 19,3 19,3 31,3 20-29,9 120 17,2 17,2 48,5 30-39,9 123 17,6 17,6 66,1 40-49,9 86 12,3 12,3 78,4 50-59,9 89 9,9 9,9 88,3 60-69,9 51 7,3 73 95,6 >70 31 4,4 44 100,0 Total 699 100,0 100,0 Total 699 100,0 Neste gráficos geralmente um espaço separa cada barra, reforçando sua natureza ordinal ou nominal (ver adiante em histogramas). Obviamente, os estilos dependerão do bom senso do investigador. Entretanto algumas dicas de bom senso serão sempre úteis: => Categorias com nomes muito extensos, devem ser acomodados em gráficos com formatos específicos para este fim (ver gráfico 1). Repare que muitas das categorias aí expostas são, na verdade, desnecessárias (pela sua inexpressiva representação). => As inúmeras alternativas em disposição pelos programas gráficos, tornam tentador a possibilidade de enfeitarmos nossos gráficos (3 dimensões, milhares de cores, etc.). Repare entretanto que dependendo do pacote utilizado, a compreensão de gráficos muito elaborados torna-se as vezes difícil. = A acurácia do gráfico é importante, isto é, mostre-o para diversas pessoas, verifique se a interpretação é homogênea. > É sempre interessante respeitar alguns princípios visuais básicos, isto é, se você necessita de tracejamentos em seus gráficos, utilize cores claras nos mesmos, reservando as escuras para suas linhas, barras etc. Realce os pontos importantes ! Histogramas são semelhantes (apenas na aparência) aos gráficos em barra (gráfico II), entretanto sua aplicação é feita principalmente nas variáveis intervalares e de razão (apesar de poderem ser utilizadas, algumas vezes nas ordinais). As barras do histograma são colocadas lado a lado, de tal forma que cada uma de suas áreas representam as fregiiências(numérica ou percentual) da categoria em questão. Cada histograma terá portanto uma área final, que será igual a freqiiência total observada em nossos dados. Sua importância será melhor detalhada quando discutirmos o próximo ponto (estatísticas univariadas). AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 26 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia GRÁFICO | - LOCALIZAÇÃO DA ENXAQUEC ANTES DA MEDICAÇÃO 300: 200º 100: > õ e o 5 e L BILATERAL OCCIPITAL OUTRA DIFUSA PARIETAL UNILATERAL LOCALIZAÇÃO DA ENXAQUECA (PRÉ-MEDICAÇÃO) GRÁFICO Il - HISTOGRAMA DA PA SISTÓ- LICA DE PACIENTES COM ENXAQUECA 140» 120º 100º so: 60 40 Sta. Dev = 12,57 2 Mean = 119,5 N=375,00 Frequency Odie 80,0 100,0 120,0 140,0 160,0 90,0 110,0 130,0 150,0 PA SISTÓLICA NA 1º VISITA Estatística descritiva para análises univariadas Como vimos na seção anterior, gráficos ou tabelas ilustram, muitas vezes de forma elegante, os dados obtidos em dada pesquisa. Existe entretanto a necessidade de se conhecer (ou resumir ) nossos dados em 4 características básicas de todas a! denominadas de tendência central, variabilidade, skewness e kurtosis. Medidas de tendência central variáveis intervalares (ou de razão). Essas características são São geralmente as mais conhecidas pelos clínicos e englobam a média, mediana e moda. A média localiza o AUTORIA: MAURÍCIO DE ANDRADE PÉREZ Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia ser dividida pelo número de observações. Repare que na fórmula 2, não levamos em conta o número total de observações e sim o total menos um. A razão para esta surpresa, numa lógica que se desenvolvia de forma tão “simples”, reside num conceito chamado de graus de liberdade (que será visto adiante). Neste momento, podemos ficar com o seguinte raciocínio: se numa amostra, tenho as medidas realizadas, bem como a média das mesmas, utilizando a média mais as (n - 1) observações realizadas, poderemos descobrir o valor que está faltando. Digamos que retiremos uma amostra de 3 pessoas de onde dosamos a hemoglobina, obtendo-se os 12+11+13 valores 12, 11 e 13. Se calcularmos a média resultante teremos : | = —>——— = 12. Como valor da 3 média (12) e qualquer combinação de duas das observações realizadas, poderei descobrir o valor da terceira D+1+y (cuja existência, para fins de cálculo, passa a ser redundante). Exemplo: ——— = 12512x3=23 3 +y >y =36-23 »y = 13. O cálculo de todas as estatísticas disponíveis em testes de hipótese passam necessariamente pelo uso deste conceito. Qualquer que seja o teste estatístico utilizado, este estará calculando um valor qualquer, que deverá ser contraposto a uma tabela que leva em consideração o teste utilizado, bem como o tipo de distribuição estatística aos quais os dados pertencem. Este valor é localizado em uma tabela (fornecida em qualquer livro de estatística ou embutida nos “pacotes de estatística” do computador), onde uma das entradas necessárias para se encontrar o valor p é exatamente o número de graus de liberdade. Outro ponto importante reside na questão do tamanho amostral. Repare que numa amostra de 10 pessoas, fará diferença dividir alguma coisa por 9 e não 10. Em amostras maiores entretanto, tanto faz dividir um valor por 399 ou 400. Esta é uma das razões, se quisermos assumir que o mundo é simples, pelas quais grandes amostras acabam se aproximando da curva de Gauss (ver adiante), facilitando em muito a tarefa de se testar hipóteses. SIMULAÇÃO DOS SALÁRIOS DE 5 MÉDICOS TRABALHANDO NUMA CLÍNICA PRIVADA SALÁRIO MÉDIA SALÁRIO - MÉDIA 1 400,00 400 - 25000 = - 24600 2 400,00 400 - 25000 = - 24600 3 450,00 450 - 25000 = - 24550 4 500,00 500 - 25000 = - 24500 5 123250,00 123250 - 25000 = 98250 TOTAL 125000,00 25.000,00 0 Medidas interpercentis, são de certo modo, conhecidas pelos clínicos, particularmente os pediatras. Se dividirmos uma distribuição em 100 partes iguais, cada pedaço será um percentil. A mediana, por exemplo, é na verdade o percentil 50 (metade dos valores estão abaixo, enquanto que a outra acima da mediana). Analogamente, poderemos calcular o percentil 25 (25 % dos valores estarão abaixo dele), 75 (75 % dos valores estarão abaixo deste) etc. Uma das medidas interpercentis utilizadas é a diferença (ou amplitude) entre os percentis 25 e 75. Tal estatística nos fornece uma idéia da distribuição ao redor da mediana. SIMULAÇÃO DOS SALÁRIOS DE 5 MÉDICOS TRABALHANDO NUMA CLÍNICA PRIVADA MÉDICO SALÁRIO - MÉDIA (SALÁRIO - MÉDIA)? DESVIO PADRÃO 1 400 - 25000 = - 24600 605160000 2 400 - 25000 = - 24600 605160000 3 450 - 25000 = - 24550 602702500 4 500 - 25000 = - 24500 600250000 5 123250 - 25000 = 98250 9653062500 TOTAL 0 12066335000 5492343 AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 30 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Se uma distribuição for extremamente dispersa (gráfico III), isto é, se não existem valores extremos (para baixo ou para cima) isoladamente, e sim a ocupação de quase toda a escala de valores possíveis para aquela variável, esta amplitude interpercentil deverá ser grande. Por outro lado, quando os valores extremos forem fatos isolados, esta amplitude deverá ser pequena. Finalmente temos a amplitude que é calculada pela subtração do maior pelo menor valor encontrado. Esta última é claramente a mais instável das medidas de variação. Ela pode ser calculada (ou fornecida) para se ter uma rápida idéia da variabilidade dos dados. Resumo O desvio padrão é de longe a mais utilizada das medidas de variabilidade. Ela sofre entretanto, se a distribuição tiver valores extremos (já que a média é incorporada em seu cálculo). Medidas de simetria Distribuições podem ser “desviadas” para a direita, esquerda, ou ainda serem centradas ao redor da média. O gráfico IV (representação da tabela 1) e V são exemplos de distribuições desviadas positiva e negativamente, enquanto o gráfico III representa uma distribuição razoavelmente centrada. Em tese, esta medida (skewness) deve se situar entre - 0,2 e + 0,2. Se levarmos em conta o seu cálculo (fórmula 3), vemos que os gráficos IV e V possuem suas médias diferindo da mediana em mais de 1 desvio padrão (DP). (media — mediana) S=———— > (fórmula 3) D.P. TABELA VI - SKEWNESS DOS BASÓFILOS, NÚMERO DE DRÁGEAS CONSUMIDAS E LEUCÓCITOS DE PACIENTES COM ENXAQUECA N Std. Valid Missing Mean Median | Deviation Skewness Std. Statistic | Statistic | Statistic | Statistic | Statistic | Statistic Error BASÓFILOS NA 1º VISITA 374 1 2599 ,0000 .5549 3,031 .126 DRAGEAS 373 2 13,76 16,00 4,86 -1,647 1126 LEUCÓCITOS NA 1º VISITA 374 1 7209,47 | 7100,00 1692,04 219 1126 GRÁFICO IV - DISTRIBUIÇÃO DE BASÓ- FILOS EM PACIENTES COM ENXAQUECA 400 300º 200º 3 100 e 5 Std. Dev =,55 z Mean =,3 Lo 1 N=374,00 0,0 1,0 20 30 40 50 BASÓFILOS NA 1º VISITA AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 31 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Principais estudos epidemiológicos Estudos Seccionais Os estudos seccionais estimam, para um dado momento (ou intervalo) no tempo, a proporção de pessoas contendo um determinado atributo (doença) e a proporção de pessoas contendo um ou mais fatores que se pretende correlacionar com a presença ou ausência do atributo (doença) em questão. Em resumo, tanto os fatores de exposição quanto os que se denominam de “risco” são medidos simultaneamente. Exemplo I: Digamos que um pesquisador queira estudar quais os principais fatores a serem associados com a hipertensão arterial. Sendo esta doença encontrada com relativa facilidade na população geral (prevalência alta) não seria complicado retirar uma amostra de uma população qualquer, examinando cada uma das pessoas no que se refere à pressão arterial, hábitos de consumo, stress, casos da doença na família etc. Exemplo II: Durante o período eleitoral, observamos a realização de predições sobre quem ganhará a eleição para diversos cargos do executivo e/ou legislativo. Semelhante ao exemplo anterior, um grupo de trabalho estabelece uma amostra da população geral, perguntando em quem o entrevistado votaria. Esta pergunta geralmente é acompanhada de um questionário estabelecendo o nível sócio-cultural do entrevistado. Exemplo HI: A cada 10 anos, realiza-se um censo no Brasil (bem como em diversos países do mundo). Este censo consiste em uma série de perguntas sobre idade, sexo, renda etc. dos entrevistados. Acompanhando este, uma amostra dos entrevistados é traçada, onde perguntas adicionais são feitas (saúde, nutrição etc.). Exemplo IV: Uma amostra de trabalhadores de uma indústria é traçada para se estudar a presença ou ausência de doenças. Um médico (ou equipe) examina os trabalhadores solicitando ou não uma série de exames complementares, bem como setor da indústria de onde o trabalhador é oriundo. Exemplo V: Num hospital geral deseja-se estimar a proporção de infecções hospitalares (IH) a cada mês do ano. Como o número de leitos é grande (cerca de 600), e a equipe da Comissão de Controle de Infeções Hospitalares (CCIH), relativamente reduzida, retiram-se amostras mensais destes pacientes, registrando dados acerca das IH, bem como setor do hospital, exposição a riscos de infeção, condição física do doente etc. Alguns fatores são comuns a todos esses estudos. Em primeiro lugar, observamos que a variável tempo não está incluída em qualquer um deles, isto é, não estamos interessados em saber qual o tempo de exposição dos trabalhadores da fábrica aos fatores de risco em questão, ou por quanto tempo o consumo de sal existia antes da pressão arterial se elevar. Na verdade, sequer sabemos se o consumo de sal estava alto “causando” a hipertensão, ou se a hipertensão fez com que o doente aumentasse seu apetite por sal. Deste pequeno exemplo, podemos portanto entender quase todas as vantagens e desvantagens dos estudos seccionais (transversais), que nos ocuparemos a seguir. Em resumo, devemos nos ocupar da população em estudo (amostra, erros e vícios na seleção desta), instrumento utilizado na avaliação, aplicações deste método e conclusões possíveis de serem, obtidas. Os 2 primeiros itens descritos acima (amostra e avaliação) fazem parte de qualquer um dos estudos a serem discutidos neste texto. Amostra Digamos que você queira determinar quantos funcionários de uma fábrica apresentam hipertensão arterial. Ao final de seu estudo, digamos que você obtenha (examinando todos os funcionários) algo como 120 hipertensos numa população total de 1000 trabalhadores (que representa o universo, ou seja, todos os funcionários somam 1000 para a referida fábrica). Alguns dos examinados representam pessoas que sequer sabiam ser hipertensas (casos novos - vamos fingir, em nome da simplicidade, que estes funcionários não AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 32 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia estivesse incorreta, de tal forma que você errasse a medida (para mais ou para menos) a cada 2 medidas. Em ambas as situações, os erros que foram registrados estavam ocorrendo de forma aleatória, ou seja, não estavam direcionados para um grupo específico de trabalhadores. Imaginemos por outro lado, uma situação onde hajam 2 entrevistadores. Um erra no sentido de registrar uma pressão mais baixa e outro registra sempre de forma mais alta do que a verdade. Vamos supor ainda que o que erra para cima entrevista sempre os trabalhadores expostos ao stress, enquanto que o outro, os demais trabalhadores. Nesta situação, absolutamente diferente da anterior, não existe apenas um erro na medida e sim um grave comprometimento da pesquisa em si, por ter havido um erro direcionado para determinado grupo. Os vieses são divididos em 3 grupos básicos (seleção, medição e interferência ou confounding). Na seleção o problema consiste numa chance maior de que os casos expostos ao fator de risco sejam selecionados. Num trabalho de campo este é um erro relativamente comum, caso alguns cuidados não sejam tomados. Pessoas mais aptas a colaborar com o entrevistador, num inquérito de morbidade, talvez sejam exatamente aquelas que apresentaram um problema de saúde recentemente. Além disso o acesso pode tornar difícil a inclusão dos mais carentes ou dos mais abonados. Uma forma de tentar contornar em parte este problema reside exatamente em sortear uma amostra para que o entrevistador seja obrigado a realizar um roteiro. O viés de informação se refere à distorção existente na estimativa do efeito que está sendo estudado, quando as medidas de exposição ou doença estão sistematicamente erradas. Tais erros são provenientes de falhas no questionário, procedimento diagnóstico, aparelhos de medição etc., de tal forma que um ou mais indivíduos são erradamente classificados quanto a sua exposição ou doença. A reclassificação dos valores assim obtidos não nos permite trabalhar do mesmo modo que no viés de seleção, isto é, quantificar ou tentar quantificar o viés de seleção através da relação entre a razão de seleção entre doentes e não doentes ou entre expostos e não expostos. (ver adiante em estudos retrospectivos) Estudos caso-controle Técnicas experimentais são conhecidas do homem há mais de um século. Grandes avanços foram feitos na experimentação com animais. A lógica residia em isolar o agente suspeito de causar uma doença (por exemplo o Mycobacterium tuberculosis ), inocular este agente em outro animal que, depois de ser sacrificado, procurava-se uma lesão contendo o agente suspeito de patogênese, fechando-se assim um ciclo agente exposição =dodnça —agehte. Apesar dePsimplista, o objetivo aqui é apenas demonstrar que seria possível formular hipóteses causais a partir de tais modelos (outros fatores como predisposição genética, fatores culturais e econômicos etc., vieram a ser incorporados posteriormente no que se denomina multicausalidade do processo saúde-doença). Este modelo entretanto não se aplica às populações humanas, pois uma vez testando a causalidade, apenas em situações muito especiais poderíamos testar esta técnica em humanos. Na maior parte das vezes, inocular o HIV para comprovar ser este o agente causador da SIDA, deverá (e com toda razão) ser considerado um crime contra a humanidade, ao melhor estilo dos experimentos nazistas. Outra limitação se refere ao tempo decorrido entre determinada exposição eo efeito que se deseja estimar (violência doméstica na infância e tendência à criminalidade, fumo e câncer etc.). Finalmente temos ainda a impossibilidade de se simular em laboratório as inúmeras interações sociais que existem quando estamos tratando de perfis psicológicos ou sociais de comportamento. Tais questões levaram Louis P.C.A. & Guy (século XIX), cientistas sociais (década de 20), Schrek (1947) e Cornfiled (1951) a desenvolver e aperfeiçoar uma técnica conhecida hoje como estudos caso-controle ou retrospectivos. A idéia básica (figura V) é a de que ao invés de inocular alguma coisa (no caso um ambiente hostil ou o HIV), selecionamos um grupo de pessoas que possuam o evento de interesse (por exemplo criminosos) que seria a população de casos. Como grupo de comparação, escolhemos uma população que não possua a doença analisada (pode ou não possuir outras). Para ambos os grupos, investigaremos os fatores que acreditamos estar “causando” “a doença e que estariam presentes no passado. * Sir Carl Popper, um filósofo inglés, já alegava que se um cientista busca a verdade, esta deverá ser procurada na filosofia, pois a verdade é um problema metafísico e jamais científico. Ao testar hipóteses, estamos examinando se nossos dados são consistentes com a hipótese formulada. Não estamos em nenhum momento provando qualquer questão. Este é um item importante e que faz parte da experiência profissional de todos os clínicos (mesmo que não tenham percebido). Mudanças radicais, em idéias antes tidas como AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 35 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Figura 5 FATORES DOENÇA Definição seleção e fonte de caso: Os casos num estudo retrospectivo são definidos como um grupo de indivíduos que possuem uma doença que se deseja investigar. A seleção destes entretanto é algo mais complexa pois deve levar em conta os múltiplos estágios em que uma doença pode se manifestar. A importância deste ponto é crucial pois se selecionamos doentes de SIDA terminal em nossa população de casos, estes terão obrigatoriamente uma série de complicações que não serão encontradas em qualquer grupo controle que não seja formado também por pacientes com SIDA terminal. A escolha dos casos passa portanto por 3 itens importantes: “sólido critério diagnóstico “fonte de casos a ser utilizada “que tipo de casos (incidentes, prevalentes ou ainda ambos) serão incluídos O critério diagnóstico deve ser claro, reproduzível e de preferência, capaz de formar grupos relativamente homogêneos de casos. Esta não é uma tarefa tão simples, pois técnicas diagnosticas variam ao longo do tempo e entre locais. Dentro do mesmo hospital, um tomógrafo pode estar disponível no início do estudo, quebrar durante meses e voltar a funcionar ao término do mesmo. Se este instrumento era crucial para se estagiar um tumor por exemplo, a pesquisa sairia seriamente prejudicada. Se houverem recursos (temporais e financeiros) podemos optar por incluir em nossa amostra diversos grupos de casos, baseados nos estagiamentos possíveis, caso contrário, a melhor opção é por um momento bem determinado da doença (hipertensão leve ou moderada ou grave - se incluirmos as 3 categorias sem maiores restrições corremos o risco de terminar nossa seleção com um grande número de casos leves ou moderados e um número não analisável de casos graves). Os casos poderão ser provenientes de 2 setores basicamente: * Todos ou uma amostra de todos os casos vistos num determinado serviço médico, num período determinado de tempo e Todos ou amostra de todos os casos encontrados numa determinada população, num dado intervalo de tempo Apesar do primeiro procedimento ser de longe o mais utilizado, o segundo é preferível no sentido de evitar vícios provenientes de fatores que possam drenar determinado perfil de doentes para a unidade médica utilizada como fonte, além de permitir a construção de taxas da doença na população e nos subgrupos relacionados com os fatores etiológicos estudados. A inclusão de casos de instalação recente (casos incidentes) diminui o n.º de diferentes estágios a serem analisados, o que facilita a interpretação dos dados. Por outro lado, casos prevalentes tendem a perder os doentes com evolução rápida (para cura ou Óbito), ficando com os chamados “sobreviventes”. As fontes de casos são inúmeras, tais como hospitais, certidões de óbito, consultórios particulares, etc. Definição, seleção e fonte de controles: Antes de selecionar os controles, deve-se decidir qual a fonte (universo amostral) a ser utilizado. O princípio geral a ser seguido é o de que se os casos são representantes de todos os doentes de uma dogmas absolutos da Medicina (leite em pó substituindo o materno - anos 50; tonsilectomia para evitar a febre reumática - anos 60; leitinho gelado - anos 50 e muitos comprimidos de cimetidine - anos 80, para tratar gastrites e úlceras que eram, pelo menos em parte, de origem infecciosa). Esta lista forma certamente uma distribuição com centenas de milhares de elementos, onde todos os médicos possuem uma experiência pessoal a acrescentar. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 36 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia determinada população, então os controles devem ser retirados desta mesma população. Podemos assim listar 3 tipos básicos de controles (hospitalares, vizinhos e populacionais). Para se iniciar a busca de controles, deve-se primeiro listar todos os fatores etiológicos suspeitos ou confirmados para a doença em estudo. No caso dos controles hospitalares, qualquer doença que afete os controles e que divida algum fator etiológico com os casos deve ser eliminada. Nos primeiros estudos sobre câncer de pulmão e consumo de cigarros, os autores selecionavam controles dentre a população ambulatorial da Pneumologia (que não tinha CA de pulmão). Como o ambulatório estava repleto de casos de bronquite crônica (que também estava associada com o cigarro, sem que os pesquisadores soubessem), a tabela resultante deste vício na seleção seria : Tabela IX Casos de câncer comparados com uma população controle do ambulatório de Pneumologia “FUMO CASOS — CONTROLES | “PRESENTE 180 160 AUSENTE 20 40 TOTAL 200 200 Repare que os controles fumantes quase igualam o números de casos de câncer também fumantes. Como a relação entre os fator (fumo) e doença (câncer) só poderá ser estabelecido se o fator estiver muito mais presente entre os casos do que nos controles, a tabela resultante, apesar de ainda demonstrar um risco maior de câncer entre os fumantes, apresenta este risco de uma forma muito subestimada em relação à realidade. Uma estratégia interessante que vem sendo aplicada nos últimos anos é a de selecionar controles (que não tenham algum fator de risco comum aos casos) de inúmeros setores diferentes do hospital. Desta forma, mesmo que alguns controles tenham fatores de risco desconhecidos porem comuns aos casos, sua presença (numérica) torna-se irrelevante frente aos outros que não possuem esta característica. axd A estimativa de risco (razão dos produtos cruzados seria dada por (vide tabela IXa) por E Por xC ora digamos que a razão dos produtos cruzados é a relação entre os indivíduos que “concordam” com a hipótese formulada (casos que apresentam o fator de risco ou controles que não possuem o fator de risco - a e d respectivamente) e aqueles que “discordam” desta hipótese (casos da doença que não possuem o fator de risco e controles que o possuem - b e d respectivamente). Esta razão varia de O a infinito, sendo que quanto maior o risco (RPC) maior seria a associação fator/doença (repare que não estou falando em causa). Quando a RPC fica próxima de 1, dizemos que não haveria associação entre as 2 variáveis e finalmente, quando os valores ficam entre 1 e zero, dizemos que este “fator de risco” se comporta como um fator de proteção (existem mais controles, não doentes, expostos ao fator do que os casos). Em nosso exemplo do câncer de pulmão, a RPC foi subestimada (mas não desapareceu) pois apresentou um valor ao redor de 2,2, significando que a doença foi 2,2 vezes mais fregiente entre os expostos do que os não expostos (atualmente sabe-se que este risco varia entre 2-3 até cerca de 30 (dependendo do número de cigarros diários e tempo de exposição prévia, fatores hereditários etc.). Tabela IXa AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 37 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Leishmaniose no Rio de Janeiro Rio de Janeiro, 1986-1997 [] Cutânea [] Cutâneo-mucosa [ | Mucosa Lbb Lbg Gráfico IV Distribuição da Leishmaniose segundo procedência Morador do RJ E] Sim [|] Não O viés de informação se refere à distorção existente na estimativa do efeito que está sendo estudado, quando as medidas de exposição ou doença estão sistematicamente erradas. Tais erros são provenientes de falhas no questionário, procedimento diagnóstico, aparelhos de medição etc., de tal forma que um ou mais indivíduos são erradamente classificados quanto a sua exposição ou doença. O reclassificação dos valores assim obtidos não nos permite trabalhar do mesmo modo que no viés de seleção, isto é, quantificar ou tentar quantificar o viés de seleção através da relação entre a razão de seleção entre doentes e não doentes ou entre expostos e não expostos. Todavia o viés de informação nos permite a criação de 2 novos parâmetros, quais sejam a sensibilidade e a especificidade. Para melhor ilustrar este ponto, examinemos a tabela X onde estão representados os dados efetivamente colhidos (população amostral) e a população para a qual pretendemos extrapolar os resultados (população alvo). AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 40 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Tabela X Ao DOENÇA EXPOSIÇÃO SIM NÃO Bo R SIM A B POPUL. ALVO NÃO c D e Co T Do POPULAÇÃO AMOSTRAL A relação entre as duas populações acima será dada por a, 8, de à de tal forma que : a= A :P= B. D= El. o= D serão as probabilidades com que uma pessoa da Ao Bo Co Do população “alvo” será membro da população selecionada na amostra. Isto nos permite calcular a razão de seleção para cada uma das células. Assim: a/ 8 será a razão de seleção para os expostos D/ 5 a razão de seleção entre os não expostos a/ & a razão de seleção entre os doentes 8/5 a razão de seleção entre os não doentes No viés de seleção, sempre que as proporções of forem maiores que &5, estaremos superestimando a RPC. No viés de informação a situação é diferente, pois o que ocorre é que subgrupos de exposição-doença são classificados erradamente nas diversas células da tabela analisada (no primeiro caso a seleção tornou mais provável a entrada de determinados indivíduos em detrimento de outros, no segundo os indivíduos são equivocadamente alocados ao longo da tabela a ser analisada). Veja as tabelas XI e XTa. Tabela XI (população amostral) DOENÇA EXPOSIÇÃO SIM NÃO SIM Ag= Antaptaortas Bos bitbp+bo+bo> NÃO Co Ctcrteaten Do= ditdiz+dartdo Repare que devido aos erros de medição, qualquer uma das células (Ao, Bo, Co ou Do) é formada por uma coleção de erros onde all são realmente os indivíduos expostos e doentes, mas ap+as+a» representam pessoas erradamente classificadas como expostas e doentes (a; é um exposto não doente, a», é um doente não exposto, a, é um não doente não exposto). O mesmo raciocínio pode ser estendido para Bo, Co e Do. Se puséssemos representar a verdade, ela estaria na tabela XIa, onde todos os erros de medição foram corrigidos, jogando-os corretamente na célula ao qual pertence. O mesmo raciocínio pode ser realizado aqui onde b;;+c;+d,, serão doentes expostos que ao serem diagnosticados (vide tabela XI) serão erradamente posicionados nas células Bo, Co e Do respectivamente. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 41 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Tabela XIa DOENÇA EXPOSIÇÃO SIM NÃO SIM A=antbyte+d B=ap+bp+ci+dy NÃO Coaprtbarteartdo D=a+baten+do Um ponto fundamental é que no viés de informação, a presença dos erros ap, a», ay... do;do1,doo, fazem com que o viés resultante não possa ser tratado como uma probabilidade pois a soma desses vieses pode exceder a unidade (isto é, aj+azr+az» fazendo com que Aq possa ser maior do que Ay. Uma maneira de resolver este problema reside em examinar a sensibilidade e especificidade para estimar a probabilidade do erro de informação. A sensibilidade é dada pela probabilidade com que os doentes expostos sejam corretamente classificados como tal. A especificidade se refere a probabilidade de acerto ao classificar os não doentes não expostos, sendo representados por: o Do = e Especificidade= ———— Ao+ Co Bo+ Do Conhecer (ou ter uma noção) sobre a sensibilidade e especificidade dos exames utilizados ou interpretados por qualquer profissional de saúde é de suma importância. Digamos que você gerencie um banco de sangue onde realiza-se a triagem para o vírus HIV de todos os doadores. Perceba que o objetivo da triagem não é o diagnóstico dos doadores e sim capacitar o banco de sangue a receber a menor quantidade de sangue contaminado possível, e fundamentalmente, tentar garantir que se houver algum sangue contaminado, este não será aceito para futuras transfusões. Se o gerente dessa unidade pudesse ter em mãos a verdade, contrapondo-a com o ELISA utilizado na triagem, teríamos uma situação semelhante a tabela XIb. A e D representam momentos onde o diagnóstico realizado pela ELISA estão de acordo com a verdade. Por outro lado, 2 tipos de erros poderão ocorrer. O primeiro diagnosticaria a doença em pessoas onde ela não existe (falso positivo) e no segundo (falso negativo) haveria a falha em diagnosticar um doador contaminado, aceitando-se o sangue para posterior transfusão (falso negativo). Por mais importante que seja diagnosticar corretamente um caso de SIDA (doença fatal com grande carga de preconceito), o fundamental no banco de sangue é tornar mínimo o número de falsos negativos. A questão relativa aos falsos positivos é, neste caso, administrativa ou seja, poderemos liberar os resultados positivos apenas após retestar o sangue (o que é realmente feito nos bancos com boa qualidade de atendimento). Voltando ao problema em questão, digamos que a sensibilidade e especificidade do ELISA seja respectivamente de 99% e 99,5% (o que é uma aproximação bastante razoável da realidade, visto que este é um dos exames mais sensíveis e específicos que existem). Aplicando este exame numa população de 100.000 doadores, com prevalência baixa de infecção (prevalência = 19%) teremos pela tabela XIc: Sensibilidade = Tabela XIb B Cc D “o que não ocorrerá com o viés de seleção onde O = —— , B =—, b=-——o 6 = Do serão no o Ao Bo Co máximo iguais a 1 (quando realizarmos o censo). AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 42 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia erro de medição com sensibilidade e especificidade de 0,8 e 0,7 para os casos e para os controles uma sensibilidade de 0,9 e especificidade de 0,8, gerando assim as tabelas XIla e XIIb respectivamente. A RPC 700x800 200x300 do que entre os não expostos). Duas tabelas com classificação equivocada poderão ser formadas (XIla e XIIb) para casos e controles respectivamente. da tabela XII (verdade) será de = 9,33 (a doença é 9,33 vezes mais fregiiente entre os expostos Tabela XII DOENÇA TOTAL EXPOSIÇÃO SIM NÃO SIM 700 200 900 NÃO 300 800 1100 TOTAL 1000 1000 2000 Tabela XIla CASOS EXPOSTOS TOTAL EXPOSIÇÃO SIM NÃO SIM 560 90 650 NÃO 140 210 350 TOTAL 700 300 1000 Dos 700 doentes expostos, a sensibilidade de 0,8 permitiu a classificação correta de 0,8 = 560, resultando em 140 indivíduos classificados como doentes não expostos. Por a “700 4 210 classificand id! 90 200 = classificando erradamente 300 pessoas. Finalmente é digno de nota que a parte que será visualizada pelo pesquisador (que não tem acesso à verdade) será o total de 650 (doentes expostos) e 350 (doentes não expostos) ao invés dos 700 e 300 que realmente existiam. Quanto aos controles (tabela XIIb) temos que : outro lado, dos 300 doentes não expostos, teremos que 0,7 = Tabela XHb CONTROLES EXPOSTOS TOTAL EXPOSIÇÃO SIM NÃO SIM 180 160 340 NÃO 20 640 660 TOTAL 200 800 1000 Dos 200 controles expostos, a sensibilidade de 0,9 permitiu a classificação correta de AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 45 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia 09= 200 = 180, resultando em 20 indivíduos erradamente classificados como controles não expostos. Por outro lado, dos 800 doentes não expostos, teremos que 0,8 = 640 classificando erradamente 160 pessoas. De forma semelhante a tabela XIla, a * 800 parte que será visualizada pelo pesquisador (que não tem acesso à verdade) será o total de 340 (controles expostos) e 660 (controles não expostos) ao invés dos 200 e 800 que realmente existiam. A tabela resultante deste vício de medição (tabela XIIc) será : Tabela XIe CONTROLES EXPOSTOS TOTAL EXPOSIÇÃO SIM NÃO SIM 650 340 990 NÃO 350 660 1010 TOTAL 1000 1000 2000 650x660 Com uma RPC de 340x350 = 3,60, formando um viés no sentido de subestimar (em mais de 200% !) o risco real de 9,33. Esta discussão está muito longe de ser um detalhe teórico. A sensibilidade ou especificidade da maior parte dos exames utilizados no meio médico raramente ultrapassam 80%. Exames radiológicos (ao redor de 70-80%), aferição da pressão arterial (50-70% dependendo do profissional, aparelho, doente etc.), nos fornecem alguns exemplos sobre a importância e magnitude deste problema. Na maior parte dos estudos epidemiológicos, a associação entre 2 variáveis deve também levar em conta a presença de fatores externos que possam alterar a associação estudada, fenômeno este conhecido como confounding ou interferência. Os princípios básicos que envolvem este fenômeno pode ser definido de forma simplista como “um fator de risco” para uma doença qualquer, cujo controle libera ou corrige parcialmente a relação exposição-doença anteriormente detectada. Em outras palavras, uma variável de interferência distorce a associação exposição-doença, por estar associada a ambas. Exemplos : a) Os primeiros estudos sobre etiologia da AIDS apontavam que a “causa” poderia ser o uso de Nitrito de amilo, apontado em diversos estudos do início dos anos 80. Descobriu-se mais tarde que o Nitrito de amilo (NA) era utilizado por homossexuais de múltiplos parceiros como um relaxante anal. O NA estava portanto associado não com a doença mas sim com os homossexuais com comportamento de alto risco (múltiplos parceiros). b) Se não possuíssemos idéia acerca da relação fumo-câncer, carregar fósforos ou isqueiro no bolso nos traria uma interferência pois fósforo-câncer possui uma associação quase tão forte quanto fumo- câncer. c) Recentemente publicou-se um livro (a curva normal) onde os autores alegavam que os negros americanos eram em média menos inteligentes que a população branca. Os autores inadvertidamente “esquecem” entretanto que a compreensão dos testes por parte da população negra, que teve menos acesso social às boas escolas, influencia na resposta dos mesmos. d) Supondo que não exista a relação entre IAM em mulheres que usem anticoncepcionais, e que as que usam estrogênios tenham uma prevalência maior de fumo, detectaremos um risco estrogênio-IAM até o momento em que possamos controlar a variável fumo (interferência). As variáveis de interferência agem em qualquer sentido, isto é, aumentando ou diminuindo uma associação estudada. É importante observar que é praticamente impossível estabelecer todos as possíveis AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 46 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia interferências entre a população amostral estudada e a população real, entre outras razoes pelo simples fato de que uma boa parte destas são desconhecidas da ciência em dado momento do tempo, sem contar o fato de que estarão sempre presentes num estudo. O ponto crucial entretanto é o de pelo menos tentar estabelecer se estas variáveis de interferência estarão sub ou superestimando o risco da população amostral estudada. Para se lidar com elas podemos agir durante o desenho do estudo ou ainda durante a análise dos dados. No primeiro caso, podemos restringir a participação para apenas alguns indivíduos (idades semelhantes ou diagnósticos localizados numa determinada fase etc.) ou ainda pareá-los para algumas variáveis que desejamos descartar. A restrição consiste em eliminar determinados indivíduos (mulheres não fumantes ou que deixaram de fumar há pelo menos 10 anos no caso do exemplo d). No pareamento escolhemos o grupo de comparação de tal forma a fazê-los semelhantes aos casos em função das variáveis de interferência que desejamos eliminar. Ainda no mesmo exemplo, para cada mulher fumante, escolheríamos um controle fumante. O pareamento possui 3 objetivos distintos : * aumentar a eficiência do estudo * controlar as variáveis de interferência * melhorar a comparabilidade das informações coletadas Os principais tipos de pareamento são os de fregiiência e o individual. No primeiro, as principais variáveis de interferência são distribuídas de forma similar em ambos os grupos de comparação (casos e controles). O pareamento individual, na sua forma mais simples, incluirá cada controle em função de cada caso, formando assim pares. Ao contrário dos estudos clássicos, a análise dos dados deverá ser realizada com técnicas que levem em consideração a formação destes pares (o que pode complicar bastante esta fase, quando necessitamos por exemplo controlar outras variáveis de interferência) durante a análise dos dados). As principais vantagens do pareamento residem exatamente quando uma interferência importante não pode ser facilmente medida, tais como fatores sociais complexos, exposições ambientais múltiplas em indústrias ou no meio ambiente, sendo útil o pareamento por vizinhos, irmãos gêmeos etc. Em contrapartida, o pareamento individual é uma técnica relativamente complexa tanto do ponto de vista prático quanto conceitual. Inúmeros controles inicialmente contactados são posteriormente descartados (perdendo-se tempo e dinheiro), existe uma maior tendência de se perder dados, pois se um membro do par não responde de forma adequada, o par inteiro é perdido, aumentando-se a dificuldade durante a análise. Finalmente, talvez a mais importante restrição a esta técnica deve-se ao fato de que a variável pareada fica perdida para análise, não nos permitindo modelá-la posteriormente (o que poderia ser feito com uma amostra maior sem pareamento). Uma outra estratégia para lidar com as variáveis de interferência é a de trabalhá-las durante a análise de dados, lançando-se mão da estratificação e da análise multivariada. A estratificação nos estudos caso-controle segue os mesmos princípios que nos estudos de coorte, isto é, os dados são divididos em estratos segundo os diversos níveis da variável de interferência, calculando-se a RPC para cada um deles. Um problema que poderá surgir (dependendo do tamanho da amostra e do número de estratos a serem formados) é a presença de poucos casos ou controles ao longo dos estratos a medida em que estes aumentam, levando em consegiiência a uma instabilidade dos estimadores que estão sendo detectados. Uma das maneiras de se contornar este problema foi desenvolvida por Mantel-Haenszel (1959) conhecido como razão de chances de Mantel-Haenszel que nos fornece uma média ponderada da RPC por estrato, ponderação esta que é dada pelo número de observações em cada estrato. Uma outra forma de controlar as variáveis de interferência, está englobada nos diversos métodos que chamamos de análise multivariada. As técnicas de análise multivariada tentam responder à questão de interação entre diversas variáveis simultaneamente. Técnicas como a regressão logística permitem o estudo de diversos fatores (alguns ordinais outros intervalares - ver adiante), fornecendo, entre outros atrativos, a possibilidade de estudar o risco desses fatores, quando controlados por todas as variáveis do modelo. Caso seja de seu interesse há uma vasta bibliografia pertinente ao assunto. Técnicas de análise multivariada exigem um analista experiente por trás das mesmas. A análise de modelos é complexa, exigindo muitas idas e vindas até se chegar ao modelo ideal. Neste processo, é fundamental a presença do clínico formando uma equipe com o estatístico e/ou epidemiologista. Alguns aspectos da análise de dados serão vistos mais AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 47 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia dos casos de câncer de pulmão atualmente registrados. Por outro lado, eliminação do mesmo fator de risco (fumo), seria responsável pela redução de menos de 10% dos casos de IAM. Desta forma, elas medem a eficácia e efetividade de manobras de intervenção em uma população. As medidas de freqiiência baseadas em casos novos ou incidentes são particularmente interessantes para se identificar fatores de risco. Analogamente estas medidas são tipicamente determinadas pelos estudos de coorte (o que explica a predileção deste método por inúmeros pesquisadores). Existem basicamente 2 medidas de incidência (risco e taxa), sendo que cada uma pode ser determinada de maneiras distintas, dependendo do método de estudo escolhido. O risco pode ser definido como a probabilidade com que uma pessoa saudável de uma referida população desenvolverá uma dada doença, num período especificado de tempo*. Como o risco trata de uma probabilidade condicional, ele é adimensional podendo variar de O a 1. Este conceito de risco implica na definição de um período de tempo onde os novos casos serão detectados. Este período por sua vez, poderá ser fixo para toda a população ou ainda ser variável, permitindo que cada indivíduo contribua com a quantidade de tempo em que permaneceu sendo observado”. A taxa de incidência por outro lado, refletirá a mudança instantânea potencial do status da doença (ocorrência de novos casos) por unidade de tempo. As duas diferenças técnicas entre risco e taxa é que a segunda além de ser dimensional, , ou seja, ser expressa em unidades de tempo, podendo exceder a unidade, a sua interpretação se refere exclusivamente à população em estudo, sem permitir uma interpretação direta no nível individual, o que não ocorre com o risco"? Como vimos acima, dificilmente poderíamos obter uma taxa instantânea. Alternativamente utilizamos a taxa média, que seria o equivalente da velocidade média de um carro (em nosso caso, a velocidade média em que um indivíduo sadio ou vivo se transforma num doente ou morto). Esta taxa média é conhecida como densidade de incidência (DI) e é estimada como: DI= PT onde Té o n.º de casos novos que ocorreram no intervalo de tempo entre o início (to) e o final da observação (tj) realizada e PT representa o número de pessoas-tempo obtidas pela soma da contribuição de tempo de cada pessoa incluída no estudo. Podemos calcular PT de duas maneiras distintas, dependendo do desenho de estudo. Caso a permanência individual de cada pessoa possa ser conhecida, ele será dado pela soma da contribuição de cada indivíduo, ou seja : N PT= Dar + onde t; será o tempo de seguimento de cada indivíduo i, desde sua entrada no estudo 1-1 até a detecção da doença ou perda do acompanhamento (morte por outra causa, desistência de participar, * Esta é uma probabilidade da população que é completamente diferente da probabilidade de determinado indivíduo. O fato de dizermos que um fumante “pesado” (mais de 2 maços por dia) apresenta um risco 20 vezes maior de adquirir um câncer de pulmão do que um não fumante, isto não quer dizer que possamos chegar a um determinado indivíduo e prever se este terá ou não câncer (por mais fumante ou virtuoso que seja). Este ponto é importantíssimo e fregiientemente interpretado de forma equivocada pelos clínicos e outros profissionais da área da saúde. * Esta última opção é bastante interessante, pois se resolvemos acompanhar trabalhadores de uma fábrica, doentes de AIDS etc. por 2 anos, pessoas poderão morrer por outras doenças, serem demitidas etc., antes de completar o período de observação estipulado. Caso possamos utilizar o período com o qual cada indivíduo contribuiu para o estudo, estas perdas não trarão maiores transtornos. 'º Ao terminar uma coorte, digamos que a mortalidade num acompanhamento de 24 meses, em pacientes com AIDS terminal e infectados com Mycobacterium avium, tenha sido de 450/1000. Como este é um dado de nossa coorte, não pensaríamos em extrapolar os mesmos para pacientes no Canadá, EUA ou São Paulo. Por outro lado, se dissermos que o risco de morrer, em até 24 meses, visto que um paciente é infectado por Mycobacterium avium é 5 vezes maior do que nos não infectados, passamos a ter um dado que pode ser extrapolado para outras populações. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 50 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia etc.). Por outro lado, quando não conhecemos os tempos individuais de seguimento At;, PT poderá ser obtido multiplicando-se o tamanho da população (N) pela duração do seguimento (At). Este segundo método assume entretanto que a população em questão deverá ser estável (não variando muito em composição etária e principalmente em tamanho ao longo do período em observação. O estudo das infecções hospitalares recebeu uma grande contribuição, através do desenvolvimento pelo Center for Disease Control (CDC - Atlanta), de um método de seguimento denominado NNISS (National Nosocomial Infection Surveillance System). Um dos componentes do NNISS, o sistema de vigilância das infecções ocorridas em CTI, ilustram de forma excepcional as questões analisadas até este ponto. Digamos que uma enfermeira ou médico da Comissão de Controle de Infeção Hospitalar visite, diariamente, o Centro de Tratamento Intensivo de determinado Hospital, anotando os dados que constam da tabela XIII. Repare que a soma da 1º coluna nos fornecerá o número de indivíduos, enquanto que a segunda a soma da duração individual de internação, que poderá ser utilizado no cálculo da densidade de incidência das infeções hospitalares, para dado CTI num referido mês. Adicionalmente, podemos calcular a densidade de incidência para diversos fatores considerados como risco (respirador, cateter central, sonda vesical), nada impedindo que a CCIH crie outros fatores (nutrição parenteral, cateter umbilical no CTI infantil etc.). Cada um destes fatores poderá fornecer uma densidade de incidência específica para a exposição de interesse. Repare que como estamos lidando com um CTI, a população é absolutamente instável, isto é, existirão perdas por inúmeros fatores não lidados à doença em questão, como alta para enfermaria ou hospital de apoio (questões financeiras), necessidade do leito para outros pacientes (grande demanda dos hospitais públicos etc.). O importante é que multiplicar a população pelo tempo de acompanhamento é um claro disparate, devido a grande flutuação destes pacientes, daí a importância de se trabalhar com a densidade de incidência. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 51 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Tabela XII DIA PACIENTES PERMANÊNCIA RESPIRADOR SONDA VESICAL | CAT. CENTRAL 10 etc. etc. 24 25 26 27 28 29 30 31 TOTAL N. de pacientes Pacientes-dia Pacientes-dia Pacientes-dia Pacientes-dia Existem 3 métodos básicos para se estimar o risco (cumulativo simples, atuarial e o de densidade). Para uma dada coorte, seguida por At anos, podemos estimar o risco calculando a proporção de indivíduos que desenvolvem a doença no período de tempo tot. Esta proporção é conhecida como incidência acumulativa (IC), possuindo como grave limitação a necessidade de que a duração do seguimento (At) de AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 52 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Gráfico V Survival Function 1; 1,01 e 8! 68! s 2 2 4 õ E S. -2 0 2 4 6 8 IDADE EM MESES As medidas de freqiiência baseadas na mortalidade são obtidas basicamente dos mesmos estudos que geram dados sobre incidência (coorte), se bem que outros estudos como o experimental e ecológico podem também incorporar dados de mortalidade. Os dados relativos aos óbitos tendem a possuir uma melhor qualidade do que informações relativas a doentes, 2 o que faz com que alguns autores utilizem os primeiros para testar hipóteses etiológicas. Os óbitos por sua vez podem ser classificados segundo 3 formas mutuamente excludentes : * A morte é devida ao evento de interesse (M,) * evento X é um fator associado ao óbito (M,,) * A morte é devida a outros fatores (M,) * total de óbitos possíveis tem de ser a soma de M, + Ms, + M, De forma análoga ao que foi discutido em incidência, a mortalidade também pode ser expressa como taxa ou risco (probabilidade). A taxa poderá ser subdividida em 3 diferentes medidas de fregiiência, dependendo como definimos o evento de interesse e a população observada (ver seminário sobre doença desconhecida no anexo). Em alguns momentos podemos estar interessados na representação (ou impacto) da mortalidade frente ao total da população. Neste caso estaremos estudando a taxa de mortalidade, como foi discutido na primeira parte deste texto. Entretanto, em determinadas situações, podemos querer verificar a fatalidade ou letalidade de dada doença, isto é, o comportamento da mortalidade, dentre as pessoas acometidas pela doença (ver tabela VI). Finalmente podemos querer examinar todas as causas de mortalidade numa dada população e tempo (mortalidade geral). 2 se pudermos supor a possibilidade de autópsia ou biópsias post-mortem, a qualidade do dado deve em tese melhorar, caso contrário, os diagnósticos resultantes terão a sensibilidade e especificidade esperados para as tecnologias empregadas nos hospitais que servem como fonte de dados. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 55 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia De forma análoga ao que discutimos na incidência, a densidade de mortalidade (DM) também poderá ser estimada através de taxas médias (densidades), que para dada doença, num intervalo de tempo N determinado (to,t) será : DM,o) = Mortes / PT onde PT = z Ati sendo N o tamanho da população observada (incluindo aí casos prevalentes pois a pessoa só apresenta risco de óbito após adoecer) e At, a duração do seguimento até a saída (por morte, retirada ou término do estudo). Quando os períodos individuais são desconhecidos, PT poderá ser calculado como o produto entre o tempo de acompanhamento e a população total (supondo-se uma população razoavelmente estável): PT = N(AS. Também podemos derivar que a densidade da mortalidade associada à doença estudada, para um (D:+ Ds) período (to.t) será: DM (o) PT Medidas de associação As medidas de associação refletem a relação entre um fator qualquer estudado e a doença de interesse. Na verdade este será sempre um dos objetivos do investigador (relacionar o fator com a doença) que aliás foi a razão pela qual o estudo foi iniciado. Se limitarmos nossa discussão apenas para as variáveis nominais ou ordinais ”, poderemos comparar as categorias formadas (sexo masculino e feminino, cor etc.), entre expostos (E) e não expostos (É). Embora todo uma imensa quantidade de estatísticas estejam disponíveis para analisar estas tabelas de contingência, elas podem ser na verdade divididas em 2 grandes categorias: razões e medidas de diferença. A razão da medida de associação é obtida através da comparação entre uma medida de fregiiência do grupos exposto a um determinado fator, dividido pelo equivalente desta medida na população não exposta. Dependendo das categorias utilizadas poderemos construir inúmeras razões correspondentes. A razão de risco por exemplo, é dada pela divisão da densidade de incidência entre o grupo exposto e o não exposto (tabela XV). Tabela XV DOENTES EXPOSTOS !3 Podemos classificar as variáveis sm 4 tipos básicos: nominais, ordinais, intervalares e razão. Classificar suas variáveis num destes 4 grupos é o primei6 passo a ser tomado durante a análise de dados. 1. Variáveis nominais - São categorfas onde não é possível atribuir qualquer valor de mensurável (masculino e feminino, brancos e negros, teste e controle etc.). 2. Variáveis ordinais - é o caso onde as categorias podem ser ordenadas de alguma forma, apesar de não podermos somá-las ou subtraí-las (pois não são números de verdade). Ex.: classe social (alta, média e baixa), melhoria dos sintomas (muito, pouco), palpação do fígado ou icterícia (+/4+ etc.) 3.Variáveis intervalares - Possuem algum tipo de escala de distância entre seus valores, podendo ser contínuas (pressão arterial, temperatura etc.) ou discretas (paridade, uma vez que a mulher não poderá ter 1.56 filhos). 4.Razões - De modo simplificado, podemos dizer que nestas variáveis o valor zero não é arbitrário (tal como na escala Kelvin de temperatura), mas sim atribuído pela natureza (pressão zero, incidência etc.). A diferenciação entre as dual últimas categorias pode ser as vezes complicada para o clínico. Para todos os efeitos todavia, qualquer das análises aqui discutidas, (e muitas das que não serão), os testes estatísticos serão idênticos para ambas as categorias. Variáveis intervalares ou de razão podem, dependendo do interesse do investigador, serem tratadas como nominais ou discretas (pressão arterial - alta, baixa, normal). AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 56 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia EXPOSIÇÃO SIM NÃO CASOS (DOENTES) A Ao POPULAÇÃO-TEMPO L L DOENTES NÃO EXPOSTOS ID: YA Razão de densidade de incidência (RDI) = —— = NA o Esta razão é conhecida como razão de risco ou risco relativo e também pode ser obtida diretamente a partir de 2 medidas cumulativas de incidência (tabela XVI) Tabela XVI DOENTES EXPOSTOS EXPOSIÇÃO SIM NÃO TOTAL CASOS (DOENTES) A B M, NÃO DOENTES c D M, TOTAL Ni No N DOENTES NÃO EXPOSTOS o RISCO RELATIVO (RR)= —— = 57. B, 1Co Bo AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 57 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia estimando taxas médias ou densidades de incidência desde que At; seja conhecido para todos (casos e não casos). Uma outra questão fundamental é o conhecimento se a exposição ao fator de risco para a doença ser extenso (cigarro, asbestos, sílica, etc.) ou curto (infeções hospitalares) em relação ao período utilizado na observação. A maior parte das doenças crônicas possuem extensos períodos de exposição ao risco, o que sugere o uso de taxas de incidência para que possamos fazer inferências causais. Por outro lado, a maior parte das doenças agudas possuem períodos de risco restritos, o que sugere a estimação destes através de uma coorte cumulativa envolvendo uma população fixa. Vieses nos estudos de coorte Ao discutirmos os estudos seccionais e retrospectivos, começamos a abordar problemas relacionados aos erros introduzidos nos estudos epidemiológicos (sendo estes potencialmente introduzidos em qualquer estudo, qualquer equipe de investigadores). Em nome da simplicidade podemos dizer que existem 2 categorias básicas de erro, os que são devidos a precisão e os sistemáticos. Os devidos a precisão decorrem de erros de calibragem de aparelhos, medidas mal feitas, perguntas mal formuladas, enfim, qualquer método que implique numa resposta errada, que em princípio estará ocorrendo de forma aleatória. Problemas de validade entretanto estão ligados a diferença entre o que queremos estimar e a verdade o que representa uma situação muito mais grave e complicada. A figura 7 e 8 apresentam ilustrações destes erros. Se quisermos examinar o prédio branco, uma pessoa muito precisa porém pouco válida, seria o observador que sempre entra e examina o prédio vermelho. Um observador pouco preciso porém válido seria aquele que examina qualquer um dos 3 prédios, apesar de entrar na maior parte das vezes no edifício branco. Figura 7 Na figura 8, temos um esquema do que aconteceria com um observador em relação a uma doença qualquer. Em I o pesquisador é muito preciso, o problema é que ele erra sempre a associação entre a doença e o fator de risco considerado (não é válido). Por outro lado, em II o pesquisador não é preciso, medindo sempre entretanto o objeto desejado (válido). AUTORIA: MAURÍCIO DE ANDRADE PÉREZ so Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Figura 8 Situação 1: preciso porém não válido Situação II: pouco preciso porém válido O fundamental é que erros de precisão tendem a ser aleatórios, podendo ser resolvidos com o aumento da amostra, maior treinamento dos entrevistadores ou examinadores etc. e fundamentalmente, atinge os 2 grupos (expostos e não expostos) numa proporção em tese equivalente. Os problemas de validade significam que estamos medindo uma coisa diferente do que gostaríamos de estimar, o que decorre de erros no desenho do estudo, variáveis de interferência etc. Um bom exemplo poderia ser a úlcera gastroduodenal que durante décadas foi associada ao stress, quando uma razoável parte dos casos (inclusive com intervenção cirúrgica) era devido a uma infecção. Dezenas de milhares de estudos sobre a eficácia de intervenções cirúrgicas, antiácidos, ansiolíticos, psicoterapia etc. estavam “olhando” um fator de risco que não tinha, em razoável parte dos casos, nenhuma relação com a verdade, apesar de serem, em maior ou menor grau, absolutamente precisos nos diagnósticos de úlcera. Ao realizar nosso estudo, é mais ou menos intuitivo que estudaremos uma amostra de pessoas (amostra de trabalhadores, pacientes que fizeram fisioterapia, gestantes expostas a determinado fator de risco, pacientes que usaram uma droga etc.). Esta população utilizada no estudo (amostra) é proveniente de um grupo maior de pessoas (população atual), disponíveis a serem estudadas, mas que não o foram devido a uma decisão econômica (o custo de uma amostra é menor). Exemplos da população atual seriam todos os trabalhadores da referida fábrica, todas as gestantes atendidas em determinado hospital ou todos os pacientes que fizeram fisioterapia num determinado serviço etc. A população atual por sua vez, pertence a um grupo maior (população alvo) de pessoas (gestantes, trabalhadores daquele tipo de produção, pacientes fisioterápicos etc.) que poderiam ter participado como populacão atual, mas não o foram por uma questão de logística e custo (listar todos os pacientes do Rio de Janeiro ou Brasil seria bem mais complicado), apesar de que gostaríamos de ter nossas conclusões, realizadas a partir de nossa amostra, aplicadas a esta população alvo. Finalmente, a população alvo é uma parte de um grupo maior (população externa) a qual não temos acesso (total de doentes no mundo ou daquela doença em todas as fases históricas), mas que também gostaríamos de aplicar nossas conclusões realizadas a partir da amostra realizada. A validade discutida anteriormente, pode ser dividida em interna e externa. Falamos de validade interna, quando extrapolamos nossos resultados para a população alvo e validade externa, quando estes são extrapolados para a população externa (ver figura 9) AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 61 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Figura 9 4 POPULAÇÃO EXTERNA POPULAÇÃO ALVO POPULAÇÃO ATUAL AMOSTRA alidade interna Validade externa Os vieses nos estudos de coorte irão operar de maneira semelhante aos verificados nos outros desenhos abordados até o momento. O viés de seleção também pode estar aqui presente pois ele é formado por uma distorção na amostra selecionada. Viés de seleção nos estudos de coorte Na tabela XVIII vamos representar tanto a amostra quanto a população alvo de onde ela foi retirada (ver figura 9 ). Cada uma das células da amostra representa um subconjunto da população alvo (por definição). Iremos designar por a, B, y e ô as diversas probabilidades com que alguém pertencente a população alvo tem de ser selecionado para a amostra, de tal forma que: Ao Bo Co Do a=——,B="— ,y="= efinalmente 8= ——. A B Cc D Neste caso, a razão de risco, determinada a partir de um estudo de coorte que utilize toda a AI(A+C) população alvo será ROR = AD/BC e a razão cumulativa de incidência RCl= ————>——7 B/(B+D) AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 62 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Tabela XIX - Coorte (com perda de seguimento) da população atual (de onde a amostra será retirada), após 30 dias de acompanhamento EXPOSTOS NÃO EXPOSTOS DOENTES 100 30 NÃO DOENTES 4400 4470 TOTAL 4500 4500 ROR (Razão de risco d: lação alvo) 100x4470 3,39 azão de risco da população alvo)= —— = 3, ports 30x 4400 100/4500 4 CIR (Razão cumulativa de incidência da população alvo)= ——>———50 = 3, (Razão cumulativ inci i populaç: vo) 30/4500 Tabela XIXa - Coorte fixa (sem perda de seguimento) da população alvo, após 30 dias de acompanhamento EXPOSTOS NÃO EXPOSTOS DOENTES 1000 = 4y 30B = 1,60 NÃO DOENTES 44007 44708 TOTAL 4500 4500 47x 44706 RORgy (Razão de risco da população atual) = =254 1,60 x 44007 47 =(4y + 44007) =384 1,66 = (1,60 +44706) CIR, (Razão cumulativa de incidência da população atual) = O risco que na verdade será medido (supondo-se a inexistência de outros vieses, que certamente é um despropósito como será visto adiante) está subestimado em 31%. Viés de informação nos estudos de coorte O viés de informação estará ocorrendo sempre que houver uma distorção, ao se estimar uma relação entre exposição-doença, de tal forma a classificar erradamente qualquer um destes. Em outras palavras, ele estará ocorrendo sempre que um entrevistado for incorretamente classificado como exposto (quando na verdade não é) ou doente (quando na verdade é saudável). As possibilidades de introdução destes erros são inúmeras tais como questionários mal aplicados, aparelhos incorretamente calibrados, erros de interpretação de exames, diagnósticos incorretos, memória seletiva para acontecimentos passados etc. As AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 65 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia tabelas XX e XXa, semelhantes ao que já foi visto nos estudos retrospectivos, voltarão a ser discutidas aqui com ligeiras modificações. Tabela XX (população alvo) DOENÇA EXPOSIÇÃO SIM NÃO SIM A=ant+byten+da B=a;+bp+ci+di> NÃO Coaprtbarteartdo D=a+baten+do Pela tabela XX (verdade) os doentes expostos (A) poderão se espalhar por qualquer uma das outras 3 células restantes. Seguindo esta lógica, a, são os indivíduos realmente expostos, doentes e corretamente classificados como tal, mas bj+ci+di, representam pessoas que serão erradamente classificadas como expostas ou não doentes (b,, será um exposto não doente, c; será um não doente exposto e dj, será um não doente não exposto). O mesmo raciocínio pode ser estendido para B, Ce D. Se puséssemos representar a verdade, ela estaria na tabela XX, onde todos os erros de medição foram corrigidos, jogando-os corretamente na célula ao qual pertence. Tabela XXa - População atual com o vício de classificação presente DOENÇA EXPOSIÇÃO SIM NÃO SIM Ag= Antaptaortas Bos bitbp+bo+bo> NÃO Co CirtCptCate» Dy= di +dip+dortdo A população atual (aquela de onde a amostra será retirada) será formada de uma parcela de classificações corretas (aj+bi+cn+di) e de outra incorreta (todas as outras). Os parâmetros a, B, y e anteriormente definidos quando analisamos o vício de seleção, não poderá ser corretamente aplicado aqui. Ao Bo Co Do — B=" ,Y=— e finalmente d=——. A B Cc D Nesta situação, podíamos falar em probabilidades pois Ag, Bo, Co e Do estavam respectivamente contidos emA,B,C, D. No viés de informação entretanto (dependendo da quantidade de erro inserido), Ao poderá ser maior do que A, o mesmo ocorrendo com Bo, Co e Do. Uma maneira de resolver este problema reside em examinar a sensibilidade e especificidade para estimar a probabilidade do erro de informação. A sensibilidade é dada pela probabilidade com que os doentes expostos sejam corretamente classificados como tal. A especificidade se refere a probabilidade de acerto ao classificar os não doentes não expostos, sendo representados por: Na situação anterior (vício de seleção), tínhamos que a = o Do = e Especificidade = ——— Ao+ Co Bo+ Do Assim como o viés de seleção, este é um vício extremamente importante podendo estar presente em qualquer estudo, como no caso, os de coorte. Imaginemos novamente o problema das infeções hospitalares (crie como exercício uma situação semelhante para outra doença qualquer). Quando dizemos que uma pneumonia é “causada” pelo respirador, esta é uma suposição que pode estar correta ou incorreta. Sensibilidade = AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 66 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Além disso, podemos diagnosticar um paciente como tendo pneumonia que na verdade não existe, ou uma ausência de pneumonia quando ela está presente (a literatura desta área aponta que cerca da metade das infecções cirúrgicas ocorrem após a alta do doente - portanto, um doente erradamente classificado como normal). A equipe da CCIH entretanto está interessada em examinar o risco de uma IH, visto que um paciente utilizou o respirador. Admitindo que a sensibilidade e especificidade deste diagnóstico seja respectivamente de 80 e 85% (em nome da simplicidade, digamos que os métodos diagnósticos não variem ao longo do tempo - aparelhos jamais estão quebrados, bem como são permanentes os métodos diagnósticos - equipes diferentes tem a mesma capacidade técnica). A população alvo pode ser vista na tabela XXI que representa a verdade. Tabela XXI - População alvo da CCIH (sem erros de classificação) EXPOSTOS NÃO EXPOSTOS DOENTES 100 30 NÃO DOENTES 4400 4470 TOTAL 4500 4500 100/4500 CIR (Razão cumulativa de incidência da população alvo) = 30/4500 — > Como a sensibilidade e especificidade estão dadas no exemplo, poderemos construir 2 tabelas, ilustrando os erros introduzidos tanto na população de expostos, quanto na de não expostos (tabelas XXIa e XxXIb). Tabela XXIa - Erros de classificação na população exposta DOENTES (VERDADEIROS) NÃO DOENTES TOTAL (VERDADEIROS) DOENTES so 660 740 NÃO DOENTES 20 3740 3760 TOTAL 100 4400 4500 080 =) = A=80eC=100-80=20; 085= 409 > 2 3740 e B=44009 3740 = 660 E sempre interessante lembrar que não conhecemos a verdade, isto é, ao aplicar o exame, “enxergamos” apenas que existem, entre os expostos, um total de 740 doentes e 3760 não doentes (números absolutamente distintos dos reais). AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 67 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia 100/600100 10/600010 * O fator fumo, caso atuasse como interferência, distorceria a relação encontrada na tabela XXII, conforme ilustrado abaixo: CIR, (Razão cumulativa de incidência da população atual) = Tabela XXIIa - Casos de neoplasia segundo exposição ao fumo, sendo que todos os pacientes pertencem a um grupo, onde a presença de câncer em familiares foi detectado previamente EXPOSTOS NÃO EXPOSTOS TOTAL DOENTES 99 60.000 60.099 NÃO DOENTES 9 6.000 6009 TOTAL 108 66.000 66.108 CIRo (Razão cumulativa de incidência da população atual) = 99160099 = 110 916009 Tabela XXIIa - Casos de neoplasia segundo exposição ao fumo, sendo que todos os pacientes pertencem a um grupo, onde a presença de câncer em familiares nunca foi detectada previamente EXPOSTOS NÃO EXPOSTOS TOTAL DOENTES 1 540.000 540.001 NÃO DOENTES 1 594.000 594.001 TOTAL 2 1.134.000 1.134.002 1/540.000 CIR, (Razão cumulativa de incidência da população atual) = ——— —— = 1 1/594.001 A CIR, (Razão cumulativa de incidência da população atual) e a razão de risco bruta foi praticamente anulada, quando estratificamos o fumo pela característica genética. Nos estudos existentes de coorte entretanto, a situação encontrada assemelha-se à tabela XXIII abaixo: Tabela XXIII - Casos de Câncer de pulmão segundo exposição ao fumo EXPOSTOS NÃO EXPOSTOS TOTAL DOENTES 100 600.000 600.100 NÃO DOENTES 10 600.000 600010 TOTAL Ho 1.200.000 1.200.110 AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 70 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia 100/600100 — 10/600010 — CIR, (Razão cumulativa de incidência da população atual) = Tabela XXIIla - Casos de neoplasia segundo exposição ao fumo, sendo que todos os pacientes pertencem a um grupo, onde a presença de câncer em familiares foi detectado previamente EXPOSTOS NÃO EXPOSTOS TOTAL DOENTES 85 200.000 200.085 NÃO DOENTES 7 400.000 400.007 TOTAL 92 600.000 600.092 85/ 200.085 nano E 24,3 CIR, (Razão cumulativa de incidência da população atual) = Tabela XXIIa - Casos de neoplasia segundo exposição ao fumo, sendo que todos os pacientes pertencem a um grupo, onde a presença de câncer em familiares foi detectado previamente EXPOSTOS NÃO EXPOSTOS TOTAL DOENTES 15 400.000 400.015 NÃO DOENTES 3 200.000 200.003 TOTAL 18 600.000 600.018 15/400015 2,5 CIR, (Razão cumulativa de incidência da população atual) = 3/200.003 * Estudos experimentais Os estudos experimentais tem uma longa história. “Teste seus servos por 10 dias; deixe-nos receber vegetais para comer e água para beber. Deixe depois que nossa aparência e a dos jovens que ingerem a rica comida do rei sejam observadas por você ...” (Daniel 1:12-13). “Tomei 12 pacientes com escorbuto... Os casos eram o mais semelhante pos 1... Os mais súbitos e visíveis efeitos benéficos foram obtidos quando estes receberam laranjas e limões... (James Lynd, 1753). Voltemos ao problema apresentado na figura 10. Uma variável de interferência (gene desconhecido B - fumo), ao estar presente numa grande proporção das pessoas com tendência de desenvolve câncer (gene desconhecido A), fez com que nosso estudo de coorte chegasse falsamente a concluir que haveria uma AUTORIA: MAURÍCIO DE ANDRADE PÉREZ n1 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia associação fumo x câncer. Digamos entretanto que pudéssemos estabelecer uma população atual (de onde a amostra será selecionada), contendo apenas jovens não fumantes. Se sorteássemos nossa amostra de tal forma que um determinado grupo (E) seria forçosamente exposto ao fumo, enquanto outro grupo (É) seria obrigatoriamente afastado do fator de exposição (fumo), estaríamos diante de uma situação, onde hipoteticamente, a única diferença entre expostos e não expostos fosse o fumo propriamente dito. Apesar desta ser uma visão demasiadamente simplista da realidade (ver adiante), nos interessa neste momento compreender princípio básico de um estudo experimental. A introdução do sorteio faria, em tese, que ambos os grupos fossem (pelas leis da probabilidade) extremamente semelhantes (desde que garantíssemos um tamanho amostral grande o suficiente), para as variáveis conhecidamente associadas à doença estudada além daquelas que a ciência ainda não estabeleceu relações de causalidade. Nesta situação, a única variável que estaria diferindo entre os 2 grupos seria o fator de exposição que se deseja medir. Esta lógica, apesar de ingênua, forma a base de sustentação dos ditos estudos experimentais. A figura 10 portanto estaria modificada (figura 11) pela presença das variáveis conhecidas ou não, semelhantemente distribuídas no grupo exposto e não exposto. Figura 11 Gene A, Gene B Fumantes Não fumantes 2 Gene A, Gene B Randomização Se estivermos trabalhando num laboratório de pesquisa básica, ao experimentar uma nova droga, ou ver o efeito de uma dada enzima, podemos (e muitas vezes fazemos) escolher animais geneticamente idênticos, ou feixes celulares recolhidos de um mesmo animal. Submetemos estes a condições controladas de pressão, luminosidade, fluxo de íons etc. A idéia por trás de tais procedimentos é a de tentar fazer com que o único fator que varie, seja efetivamente o que se quer testar (ao menos em tese pois variações de temperatura e luminosidade do biotério, bem como a capacidade técnica do pesquisador ou de seus instrumentos de medição podem alterar várias das observações realizadas). Na pesquisa clínica este processo é, em grande parte, inviável, pois mesmo que trabalhássemos com gêmeos, não existem tantos espalhados pelo mundo e disponíveis para todas as pesquisas clínicas realizadas; uma série de fatores pessoais (conhecidos ou não), incontroláveis em sua maioria podem interferir com nossas conclusões. A randomização pode ser definida portanto, como um processo que tenta criar grupos homogêneos e comparáveis, em respeito aos fatores conhecidamente associados com a doença, bem como aqueles que são desconhecidos do pesquisador. Existem inúmeros métodos de randomização, alguns dos quais serão aqui abordados. Randomização por alocação fixa Este método aloca indivíduos, segundo uma proporção fixa, (geralmente 50%) e é dividido em 3 métodos: simples, por blocos e estratificada. Simples Esta é talvez a forma mais difundida (e intuitiva) dos processos de randomização. Um exemplo deste método seria o de lançar uma moeda. Toda vez que saísse cara, o paciente seria designado para um grupo (teste por exemplo), caso contrário, para o grupo controle. Existem maneiras muito mais elegantes de se realizar o mesmo processo. Uma delas é a utilização de tábuas de números aleatórios. Tais tabelas são reproduzidas em qualquer livro de estatística básica e representam, um sorteio realizado AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 72 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia aproximadamente equânime, eliminado portanto os vieses de seleção. No mundo real entretanto isto nem sempre ocorre. A inclusão de várias categorias clínicas de doentes pode fazer com que os mais graves sejam relativamente poucos, o que tornaria não pouco provável a inadvertida alocação destes, em maior proporção para um dos grupos em estudo. Imagine um estudo contendo 60 doentes (30 para cada grupo), onde 15 são os mais graves. Não é improvável a inclusão de 10 (o dobro) dos mais graves para qualquer dos 2 grupos formados, introduzindo portanto o viés. Por outro lado, é relativamente comum realizar estudos experimentais em pacientes que haviam participado de protocolos anteriormente, o que faz com que estes sigam a orientação dos pesquisadores de uma forma muito mais fidedigna do que os que encontraríamos na clínica diária. Nos vieses de medição, todos os problemas relativos a sensibilidade e especificidade estarão obviamente presentes. Podemos tentar minimizar os vieses de medição ao adotar a estratégia de “cegamento”. Um paciente alocado para o tratamento antigo, mas que acredite ser o novo a melhor opção para sua doença, tenderá a maximizar todos os efeitos colaterais ou vice-versa. Dizemos que cegamos o paciente quando este não sabe qual tratamento está recebendo. Num passo adiante, podemos também imaginar com certa facilidade a tendenciosidade do pesquisador, no sentido de maximizar os efeitos negativos do tratamento tradicional e minimizar estes efeitos no travento novo que está propondo. Se conseguirmos evitar que o médico que avalia os doentes conheça a natureza da droga utilizada (antigo ou novo), estaremos diante de um duplo-cego, isto é, nem médico ou paciente saberão qual a droga utilizada. O epidemiologista ou estatístico responsável pela análise poderá também influenciar nos resultados da pesquisa, a não ser que também desconheça a natureza da droga até o momento em que concluir qual deles apresenta melhores resultados (triplo cego). A lógica desta técnica é exatamente a de minimizar os vieses introduzidos pelos participantes traduzidos pelos pré-julgamentos inerentes a este tipo de situação. Na prática porém, nem sempre é fácil evitar que o clínico conheça qual dos tratamentos está sendo aplicado, sendo que em determinadas situações (dermatologia, cirurgia etc.) tal técnica é quase ou totalmente impossível, mesmo que se tenha o cuidado de introduzir a randomização por blocos. Finalmente os vieses de interferência poderão estar presentes por através de inúmeros mecanismos. A estratificação de nossos dados contudo, nem sempre será factível, visto a dificuldade de se encontrar uma amostra suficiente de voluntários para nossos estudos. A discussão ética abordada anteriormente deve sempre estar na mente dos investigadores. Utilizar placebos!* para comparar doenças de intensidade moderada ou grave podem constituir um perigoso precedente para a humanidade. O estudo sobre etiologia de doenças deve ser obviamente descartado para a maioria quase absoluta das situações, pois em princípio estaremos causando a doença em um dos grupos expostos'*. Análise de dados Sir Carl Popper, um filósofo inglês, já alegava que se um cientista busca a verdade, esta deverá ser procurada na filosofia, pois a verdade é um problema metafísico e jamais científico. '$ Drogas em tudo semelhantes ao remédio real, mas que contém apenas a aparência de uma droga ativa. Eles são geralmente confeccionados com amido e corante, cabendo ao farmacêutico a construção de uma “droga” de preferência idêntica em cor, sabor, odor etc. ao remédio real. * Poucas situações poderiam escapar desta regra. Uma delas incluiria doenças benignas e passageiras como gripe. Um dos grupos seria exposto à chuva e vento e outro estaria “protegido” em local aquecido. Poderíamos estudar assim a incidência de gripe nos 2 grupos. Infelizmente o mundo já assistiu a inúmeros experimentos em anima nobile. Na 2º Guerra Mundial, médicos nazistas estavam interessados em estudar a fisiologia humana nas condições adversas do mar Ártico (condições encontradas por pilotos alemães derrubados no oceano). Para atingir este objetivo, centenas de prisioneiros russos foram deixados em tanques em pleno inverno polonês até que morressem (necessitava-se também conhecer o tempo de sobrevida nestas condições. Nos EUA, no auge da guerra fria, soldados eram postos a marchar em campos onde houvera a recente detonação de artefatos nucleares. A idéia era que seria necessário testar as “condições psicológicas das tropas” numa futura e inevitável guerra nuclear. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 75 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Ao testar hipóteses, estamos examinando se nossos dados são consistentes com a hipótese formulada. Não estamos em nenhum momento provando qualquer questão. Este é um item importante e que faz parte da experiência profissional de todos os clínicos (mesmo que não tenham percebido). Mudanças radicais, em idéias antes tidas como dogmas absolutos da Medicina (leite em pó substituindo o materno - anos 50; tonsilectomia para evitar a febre reumática - anos 60; leite gelado - anos 50 e muitos comprimidos de cimetidine - anos 80, para tratar gastrites e úlceras que eram, pelo menos em parte, de origem infecciosa). Esta lista forma certamente uma distribuição com centenas de milhares de elementos, onde todos os médicos possuem uma experiência pessoal a acrescentar. Ao formular hipóteses portanto, devemos sempre admitir a possibilidade de erro. Definimos hipótese nula (Hg) como a hipótese de que não há diferença entre dois tratamentos propostos, ou a evolução de 2 grupos de pacientes etc. Por outro lado, a hipótese alternativa (H,) é o que desejamos comprovar. Caso seja encontrada alguma “diferença” estatística (ver adiante) abandonamos a hipótese nula (H,) e adotamos a alternativa (H,). Digamos que desejássemos demonstrar que o uso de AZT em pacientes grávidas reduziria a incidência de SIDA perinatal (H, : incidência de SIDA não é reduzida pelo uso de AZT; H;: SIDA perinatal é reduzida pelo uso de AZT); (Hg ) pacientes com CD4 abaixo de 100 e infectados pelo Mycobacterium avium têm sobrevida igual à dos pacientes com CD4 abaixo de 100 e não infectados pelo Mycobacterium avium; H,: há diferença nas sobrevidas. Após analisar os dados, o pesquisador “aceita” a hipótese nula, quando os resultados não se mostram significantes (p > 0,05). Por outro lado, rejeita-se a hipótese nula (ou aceita-se a alternativa) quando detectamos diferenças significativas (p < 0,05). Se expressarmos numa tabela a verdade, contra a decisão do pesquisador (tabela VI), teremos 4 possíveis situações. Em duas delas, não haverá qualquer problema, visto que a decisão do pesquisador coincide com a verdade. No erro tipo 1 o pesquisador estará, por exemplo, decidindo que seu tratamento é melhor quando na verdade não é. Por outro lado, no erro tipo estará decidindo que o tratamento não aumenta a sobrevida, quando na verdade ele o faz. Qual o mais importante erro ? Bem, depende da situação. Digamos que estejamos tratando um caso de raiva humana (letalidade de 100%); neste caso o erro tipo II é mais importante. Se o tratamento agora versa sobre pessoas apenas infectadas pelo vírus, o erro tipo I é certamente muito mais importante. Estabelecer claramente aonde você está com sua hipótese não é apenas uma curiosidade teórica. O erro tipo I (também chamado de a) poderá ser diminuído, caso aumentemos o nível de significância do teste (rejeitar a hipótese nula com valor p abaixo de 0,01 ao invés de 0,05). Desta forma haverá apenas 1 chance em 100 de cometermos este erro (ao invés de 1 em 20, que é o nível de significância geralmente aceito), em outras palavras, estaremos o poder do teste pois como o mundo não é perfeito, aumentará a chance de você concluir que seu tratamento não funciona, quando na verdade ele está aumentando a sobrevida de seus doentes (erro tipo Il ou B). Para não cometermos o erro tipo B, diminuímos o nível de exigência do teste (valor p de 0,10 ao invés de 0,05), que resulta num maior poder do teste e também numa maior possibilidade de erro tipo I. Como você pode ver , voltamos em parte ao nosso problema filosófico. Outras maneiras de mexer com o erro tipo II são aumentar o tamanho amostral (custo mais alto), diminuir as fontes de variação (melhor treinamento dos examinadores, técnicas diagnosticas mais precisas ou mandar que seus doentes não variem, um comportamento biológico que é, por natureza, individualmente variável - pressão arterial, grau de imunidade, etc.). Testes uni e bicaudais Vamos retornar ao gráfico II que é um bom representante de uma distribuição normal. Quando dizemos que um tratamento foi estatisticamente significante, estamos dizendo que o valor encontrado está acima dos 1,96 DP da curva de probabilidade da variável estimada, ou ainda, a chance de encontrar este valor na minha distribuição é menor do que 0,05 (daí o valor p), ou ainda (e finalmente), a diferença que encontrei, comparando a média de sobrevida com meu novo tratamento, em relação ao antigo, é tão grande, que a chance desse fenômeno ser observado é menor do que 0,05 (um evento raro demais para estar ocorrendo ao acaso), portanto, meu tratamento novo deve estar causando esta diferença. Acontece que a diferença poderá estar em qualquer um dos lados da curva (1,96 DP acima ou 1,96 DP abaixo). O teste unicaudal, se refere ao pesquisador que está olhando apenas para um lado da probabilidade, enquanto que no bicaudal olhamos para os 2 lados. Porque esta diferença ? Bem, os testes unicaudais apresentam maior poder, pois o resultado do teste não precisa ser tão grande para nos fornecer a significância desejada. Se olharmos a evolução da Leishmaniose no HEC, a média do tempo de evolução da doença segundo o sexo nos forneceu um teste t (Student) de -1,945 (p < 0,05) e -2,05 (p < 0,03) para testes respectivamente bi e AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 76 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia unicaudais. Tabela XXIV VERDADE DECISAO DO PESQUISADOR ACEITAR Ho REJEITAR Ho ACEITAR Ho ACERTO ERRO TIPO II (B) REJEITAR Hoy ERRO TIPO I (a) ACERTO Neste caso, a diferença era tão grande que a opção era desnecessária. Ocorrerão situações, entretanto, onde a diferença entre as médias é limítrofe, e aí a sua opção fará com que o teste seja ou não significante. Se pudermos saber para que lado da curva a diferença será testada, o teste unicaudal é uma opção, caso contrário, utilize sempre o bicaudal (seja mais conservador !). Seja qual for a sua opção, é sempre interessante (ou tecnicamente mais aceitável) descrever em seus resultados (ou procurar quando estiver lendo) qual opção feita pelo pesquisador. Intervalo de confiança As médias são estimativas pontuais de determinados atributos da população. Lembremos que esta é uma estimativa obtida de uma amostra da população (cuja verdadeira média é desconhecida). O intervalo de confiança, por outro lado, nos dará um intervalo onde a verdadeira estará situada, dentro de uma probabilidade conhecida. Num outro exemplo sobre a Leishmaniose (formas clínicas cutânea e cutâneo- mucosa contra as formas mucosas em relação ao tempo de evolução da doença - ver tabela XXV), temos que não só a diferença médias entre as formas clínicas era estatisticamente significativa, como também existe 95% de probabilidade, da real diferença dos tempos de evolução se situar entre -133,66 e -105,79, ou seja, não só temos uma diferença estatística, como também o intervalo de confiança reforça em muito essa característica. Tabela XXV Independent Samples Test Levene's Test for Equality of Variances. ttest for Equalty of Means. 95% Confidence sig. Mean | Std. Error | Interval of the Mean E Sig. t & | (2taileg) | Difference | Difference | Lower | Upper TPEVOLUC Equal variances | 626,498 .000 | 16,869 e14 000 | -119,7251 7,0975 | 13366 | -105,79 assumed Equal nar eos -5,774 | 64,010 000 | 119,7251 | 20,7353 | 161,15 | -783018 assumed Digamos que você encontre um artigo associando que a presença de uma de fatores e UTI neonatal aumenta o risco de Infeção hospitalar (IH) em 20 (a IH é 20 vezes mais fregiiente nas crianças que apresentam aqueles fatores do que nas que não apresentam). Digamos ainda que esta associação é significativa (p < 0,05). Se o intervalo de confiança deste risco ficar entre 1 e 400, o autor está verdade dizendo que o risco (pontual) é de 20, mas existe 95% de probabilidade dele estar situado entre 1 (ou seja, não há associação) e 400 (fortíssima associação). Em outras palavras, o autor está dizendo que nem ele (nem ninguém) sabe qual o impacto destes fatores na população de onde a amostra foi retirada. O intervalo de confiança é uma função da variabilidade de seus dados, estes por sua vez são função do tamanho amostral. Pequenas amostras estão muito propensas a este tipo de problema. Uma forma de tentar (nem sempre é factível) contornar esse problema é identificar antes de começar o estudo, qual a diferença que se espera obter quando comparamos 2 tratamentos. Se esta diferença for pequena, e for economicamente inviável aumentar a amostra, você certamente estará entrando neste universo de dúvidas frente aos seus resultados. Resumo AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 77 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia terminaria aqui. Repare, entretanto, que quanto maior for a quantidade de dados (categorias) na minha tabela, maior terá que ser a diferença entre as categorias, para que o teste do x dê alguma significância. Como as raças branco e mulato são muito semelhantes na tabela XXVI, vamos colabá-las em um único grupo (brancos e mulatos). Na tabela X vemos o resultado desta transformação. Tabela XXVII FORMA CLÍNICA DA LEISHMANIOSE * COR RECLASSIFICADA Crosstabulation COR RECLASSIFICADA, BRANCOMULATO | NEGROS | Total FORMAGINICA | CUTANEAs Coumt 375 176 557 DA LEISHMANIOSE CUTÂNEO-MUCOSA Expected Count a828 1682 | 5510 % of FORMA CLÍNICA DA 68,1% 31,9% 100,0% LEISHMANIOSE of COR RECLASSIFICADA 876% | 936% | 89,4% MUCOSA Count 53 2 65 Expected Count 45,2 19,8 65,0 % of FORMA CLÍNICA DA 81,5% 18,5% 100,0% LEISHMANIOSE of COR RECLASSIFICADA 12,4% 6,4% 10,6% Total Count 428 188 616 Expected Count 428,0 188,0 616,0 % of FORMA CLÍNICA DA 69,5% 30,5%. 100,0% LEISHMANIOSE a RIFICADA 100,0% 100,0% 100,0% teste RV resultante (Tabela XVIla) mostra que tanto no Fisher quanto no Pearson (diferentes “famílias” do mesmo teste w ) o valor p foi significante (o melhor teste w neste caso é o Fisher, pois uma das células tem valor esperado menor do que 5 - o Epiinfo avisa sempre que isto ocorre). Vemos ainda nas tabelas XXVIa e XXVIla o número de graus de liberdade. De forma similar ao que foi exposto acima, numa tabela 2 x 2, se conhecermos os totais das linhas e colunas, basta que se forneça o conteúdo de uma das células (um grau de liberdade) para que possamos reconstruir a tabela inteira. Em termos algébricos , ele é calculado como (colunas - 1) x (linhas - 1). Existem inúmeros testes numa verdadeira “família” que chamamos % - Qual deveremos usar ? O teste de Pearson geralmente é menos exigente (mais poderoso) do que todos os outros, isto é, ele tende a reportar diferenças estatísticas quando outros testes não o fazem. O Yates (nas tabelas XXVIa e XXVIIa representados como continuity correction) é mais conservador. O teste de Fisher deve ser utilizado quando a fregiiência esperada em qualquer célula for menor do que 5. McNemmar é usado quando nossa tabela é utilizada para analisar dados pareados (por exemplo, melhoria da enxaqueca antes e depois do tratamento, casos de SIDA perinatal em mães que usaram ou não AZT e pareadas pela dosagem de CD4 etc.). AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 80 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Tabela XXVIa Chi-Square Tests Asymp. Exact Exact Sig. Sig. Sig. Value df (2tailed) | (2tailed) | (I-tailed) Pearson b Chi-Square 4.983 1 026 Continuity Correction? 4,367 t 087 Likelihood Ratio 5,420 1 020 Fisher's Exact Tesé ,032 016 N of Valid Cases 816 a. Computed only for a 2x2 table b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 19,84. Outras técnicas não paramétricas muito utilizadas são o teste de Mann-Whitnney U e o Kruskal- Wallis H (ambos encontrados no Epiinfo). Estas outras técnicas não paramétricas tratam da comparação entre a média observada de dois grupos (por exemplo, tempo de remissão da tuberculose quando comparamos 2 esquemas terapêuticos) Este tema será revisto a seguir, quando falarmos com mais detalhes do teste t de Student e análise de variância. A questão aqui, entretanto, é a de comparar duas médias quando sabemos que suas distribuições não são Gaussianas ou ainda quando a variância de ambas é diferente. Repare os gráficos VI e VII, Independente do tipo de distribuição (normal ou não), as formas cutâneas/cutâneo-mucosa tem uma variação ao redor da média (variância ou DP 3, muito menor do que as formas mucosas (o que aliás não é surpreendente para um clínico). A comparação das duas médias, portanto, não poderia ser feita por um teste paramétrico. Se olharmos a saída desta comparação, feita pelo Epiinfo (tabela XVIII), veremos que na 1º parte foi liberada uma série de estatísticas (média, mediana, variância, DP, etc.) para os 2 grupos analisados (1 e 2, cutânea/cutâneo-mucosa e mucosa respectivamente). AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 81 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia GRÁFICO VI - TEMPO DE EVOLUÇÃO DA FORMA CUTÂNEA E CTM A LEISHMANIOSE NO HEC eo 500" 400º 300" np S E) Std. Dev = 17,28 Mean =5,0 N=577,00 Frequency 8 o 0,0 100,0 200,0 300,0 50,0 150,0 250,0 350,0 TPEVOLUC GRÁFICO VII - TEMPO DE EVOLUÇÃO DA FORMA MUCOSA LEISHMANIOSE NO HEC 40 30 20 > 2 10 s Std. Dev = 167,17 z Mean = 1234 u D+ N=65,00 0,0 100,0 200,0 300,0 400,0 500,0 600,0 700,0 TPEVOLUC AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 82 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Tabela XXIX Levene dft df2 sig. Tempo de 2,449 2 469 0.087 tratamento ANOVA Tempo de Sum of df Mean F Sig. tratamento Squares Square Entre 749.538 2 374.769 5.466 0.005 grupos Dentre 32158.0 469 68.567 grupos Total 32907.5 4 Multiple comparisons Dependent : Tempoe entre tratamentos Scheffe (D forma (J) forma Means Std Error Sig. clínica da clínica da Difference (I-J) Leishmaniose Leishmaniose Cutânea cutâneo- -1.928138 1.679 0.517 mucosa mucosa -3.530702 1.104 0.006 cutâneo- cutânea 1.9281377 1.679 0.517 mucosa mucosa -1.602564 1.917 0.705 mucosa cutânea 3.5307018 1.104 0.006 cutâneo- 1.6025641 1.917 0.705 mucosa AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 85 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia A tabela XXIX nos mostra à ANOVA realizada pelo SPSS (qualquer pacote estatístico de razoável qualidade tem que realizar este teste). Repare que tenho 3 formas clínicas da Leishmaniose (cutânea, cutâneo-mucosa e mucosa), onde nos interessa comparar os tempos de tratamento. Nesta tabela o programa testa a homogeneidade das variâncias (que é uma das condições para se utilizar esta análise, sendo importante perceber que não foi significativamente diferente - p > 0,05), o que nos leva a prosseguir com a análise. A seguir, pode-se perceber que havia uma diferença entre os grupos examinados, o que responde uma parte de nossa pergunta. Sabemos agora que 2 situações podem ocorrer: um dos 3 grupos difere dos outros 2 (que são iguais) ou todos os 3 grupos diferem entre si. Finalmente, vemos que forma cutânea era estatisticamente diferente da mucosa, mas não da cutâneo-mucosa. Esta última não difere da forma mucosa, o que talvez o configure como um grupo intermediário (o que, aliás, faz sentido clinicamente). A análise de variância pode ser estendida para situações onde mais de uma variável dependente ou independente seja analisada. Este assunto é abordado no capítulo de análise de variância multifatorial. Estes modelos são interessantes não só por serem econômicos (permitem estudar uma série de hipóteses simultaneamente), como também permitem visualizar interações entre as variáveis analisadas (ou seja, se o tratamento que está sendo avaliado varia de acordo com os grupos ou condições em que são aplicados. Correlação e regressão Diante de 2 variáveis numéricas, podemos estar interessados em estudar 2 aspectos: O qual a relação entre as duas ? O existiria uma maneira de prever o valor de uma, visto que tenho o valor da outra? Na tabela XXX respondemos a uma das questões. Reparem que quando examinamos a relação entre as 2 variáveis, encontramos um coeficiente de correlação de 0,15, que foi estatisticamente significante. O coeficiente de correlação de Pearson (aqui analisado) é uma medida que varia entre -1 e +1. Quando este é de - 1, dizemos que as 2 variáveis estão perfeitamente correlacionadas (de forma inversa), formando uma equação de reta, onde quando uma das variáveis aumenta, a outra diminui. Quando este coeficiente é de +1, elas também estão perfeitamente correlacionados (de forma direta), e que à medida em que uma aumenta, a outra também aumenta. Finalmente quando este é zero, dizemos que não há correlação, ou melhor, que as 2 variáveis não se correlacionam como uma reta (a função que as representa poderia ser logarítmica, exponencial). Quando comparamos o tempo de evolução da Leishmaniose com o tamanho da área corporal afetada, vemos que a correlação é de 0,15 (15%), o que é muito baixa, apesar de estatisticamente significante. Se quisermos representar esta relação numa equação de reta esta seria do tipo tempo de evolução = área x 0,009 + 2,94. Cabe aqui listar algumas considerações importantes. = A significância estatística é UM DOS COMPONENTES DA ANÁLISE. Se ele não estiver acoplado com um senso clínico, muita asneira poderá sair de um pacote estatístico (volto a frisar a importância de uma equipe multidisciplinar). O fato de poder criar uma função relacionando tempo de evolução com área afetada não quer dizer que haja sentido prático nesta relação. = fato de haver uma relação estatisticamente significativa não implica numa relação clinicamente significante. Um coeficiente de correlação de 0,15 é muito baixo como modelo preditivo, qualquer que seja a relação estatística daí retirada. Tabela XXX AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 86 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Correlations AREA | TPEVOL Pearson AREA 1,000 15º Correlation TPEVOL 151 1,000 Sig. AREA , 001 (2-tailed) TPEVOL 001 , N AREA 522 522 TPEVOL 522 699 *. Correlation is significant at the 0.01 level (2-tailed). GRÁFICO VIll- REGRESSÃO ENTRE EVOLUÇÃO E ÁREA CORPÓREA LEISHMANIOSE, HEC 70: 60 TEMPO DE EVOLUÇÃO so 40 30 20º 10 | = Observed 0 =D e Linear -100 0 100 200 300 400 500 600 AREA AUTORIA: MAURÍCIO DE ANDRADE PÉREZ Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Análise de uma epidemia por doença desconhecida Durante anos, médicos residentes do sudeste de um determinado país em desenvolvimento, alertavam para o surgimento de um doença até então desconhecida. Como a notificação era obrigatória em apenas uma região deste país, e a assistência médica bastante elitizada e mal distribuída, o registro da incidência para esta nova doença era bastante irregular. Dados gerais A doença em questão, embora facilmente diagnosticada , do ponto de vista clínico, era de etiologia completamente desconhecida até então. A patogênese, bem como o modo de transmissão, imunidade, papel social e ambiental eram matérias de controvérsia no meio acadêmico. Num esforço para determinar a extensão do problema, um questionário foi enviado a todos os médicos residentes nos oito estados que compunham o sudeste deste país, solicitando basicamente o número de casos da doença, vistos nos últimos 5 anos. Apesar de apenas um pequeno número de médicos terem respondido ao questionário (25%), o número de casos conhecidos pulou de 622 para 7017 no período de tempo investigado (5 anos). No ano seguinte, um epidemiologista do serviço de saúde pública deste país foi enviado à região para investigar esta epidemia. Após algumas observações preliminares, um inquérito foi realizado para determinar a extensão e gravidade do problema. I. Você consideraria esta como uma situação de epidemia ? justifique. H. Em quais categorias etiológicas básicas, você poderia dividir as doenças passíveis de se apresentar sob a forma de uma epidemia ? q Investigação A área avaliada pelo inquérito, compreendia cinco municípios do sudeste deste país, onde sabia-se que uma alta incidência da doença vinha ocorrendo nos últimos anos. Uma série de 24 pequenas vilas, com populações variando entre 500 e 1500 pessoas foram selecionadas para o estudo. Estas vilas variavam enormemente de acordo com suas condições sanitárias. Algumas possuíam serviços de abastecimento de água ou esgoto, algumas ambos e finalmente, outras não possuíam qualquer infra-estrutura de saneamento. Recolheram-se dados relativos ao nome, idade, sexo, profissão, estado civil e condições da moradia. O estudo amostrou apenas indivíduos pertencentes a um determinado grupo racial, composto de pequenos proprietários agrícolas. Todos os casos duvidosos foram reavaliados pelo médico responsável pelo inquérito, que por sua vez possuía grande experiência no diagnóstico desta enfermidade. Que outras informações deveriam ter sido incluídas neste inquérito ? Aponte algumas das falhas deste estudo. HI.Observe as tabelas I e II, bem como os gráficos correspondentes. Quais doenças poderiam apresentar a distribuição de frequência aqui visualizada ? IV.Poderíamos dizer que a doença teria um componente sazonal ? AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 90 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia TABELA I CASOS DA DOENÇA DESCONHECIDA, SEGUNDO MÊS DE DIAGNÓSTICO, EM 24 VILAS ANALISADAS DURANTE UM ANO (POPULAÇÃO TOTAL DE 22.653), PAÍS X. Mês N.º de casos Taxa (por 1.000 hab.) Janeiro 0 0.0 Fevereiro 4 0.2 Março 28 1.2 Abril 120 5.5 Maio 310 13.7 Junho 432 19.7 Julho 154 6.8 Agosto 57 2.5 Setembro 28 1.3 Outubro 14 0.6 Novembro 0 0.0 Dezembro 0 0.0 Gráfico I Casos da doença, segundo mês de diagnóstico em 24 pequenas vilas analisadas durante umano 20 q 1 1 VA 15 À Vo | 10 | | N /) 54 5, Í N - A A 0 - O f Jan Fev Mar Abr Mai Jun Ju Ago Set Out Nov Dez Mess V. Utilizando os dados apresentados na tabela III, compare as taxas de incidência entre as mulheres soleiras e casadas. VI.Observando a tabela IV, analise as taxas de incidência para: a) Trabalhadores em moinhos contra não trabalhadores (independente do sexo e idade). b) Mulheres que trabalham em moinhos contra mulheres que não trabalham. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia c) Homens trabalhando em moinhos contra homens que não trabalham. Quais as conclusões ? e TABELA H INCIDÊNCIA DA DOENÇA DESCONHECIDA, SEGUNDO SEXO E IDADE, EM 24 VILAS PESQUISADAS DURANTE UM ANO Masculino Feminino Idade População Casos Incidência População Casos Incidência <1 3227 0 0.0 365 0 0.0 1 233 2 8.6 205 1 4.9 2 408 30 73.5 365 16 43.8 3 368 26 70.7 331 28 84.6 4 348 33 94.8 321 32 99.7 5-9 1574 193 122.6 1531 174 113.7 10-14 1329 131 98.6 1276 95 74.5 15-19 1212 4 3.3 1510 17 11.3 20-24 1055 1 0.9 1280 51 39.8 25-29 882 1 141 997 75 75.2 30-34 779 4 51 720 47 65.3 35-39 639 4 6.3 646 51 78.9 40-44 469 10 21.3 485 34 70.1 45-49 372 7 18.8 343 18 52.5 50-54 263 13 49.4 263 12 45.6 55-59 200 5 25.0 228 6 26.3 60-64 164 9 53.6 153 3 19.6 65-69 106 4 37.7 105 2 19.1 > 70 80 6 75.0 114 2 17.5 TOTAL 10812 483 44.7 11238 664 59.1 AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 92 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia TABELA V DISTRIBUIÇÃO DE CASOS DA DOENÇA, SEGUNDO DOMICÍLIO E NÚMERO DE MORADORES Domicílios N.º de moradores Domicílios contendo apenas um caso de doença 10 60 Domicílios contendo mais de um caso de doença 40 300 Domicílios não contendo nenhum caso da doença 990 3800 Total de domicílios 1040 4160 Para examinar a possível relação entre status sócio-econômico e a doença em questão, os pesquisadores analisaram a incidência segundo renda familiar semanal média (tabela VD. e TABELA VI INCIDÊNCIA DA DOENÇA DESCONHECIDA, SEGUNDO RENDA FAMILIAR SEMANAL, DURANTE UM ANO DE OBSERVAÇÃO, PAÍS X Renda(*) População Casos Incidência <2.50 796 99 124.4 2.50-3.49 2888 240 83.1 3.50-4.49 4868 260 534 4.50-5.49 5035 177 35.2 5.50-7.49 5549 132 23.8 7.50-9.49 1832 23 12.6 29.50 769 2 2.6 Total 21737 933 42.9 XI.Que fatores poderiam estar ligados ao poder aquisitivo e um maior risco de estar doente ? XI.A tabela VI consegue descartar algumas etiologias de doença ? justifique. Com o intuito de investigar as condições sanitárias, desenvolveram-se inquéritos perguntando sobre a higiene de uma forma geral, destino do esgoto, bem como abundância e qualidade da água nas 24 vilas. Estes dados foram transformados em um índice sanitário (ver gráfico III) e comparados com a incidência correspondente. Estas características sanitárias são compatíveis com uma doença infecciosa ? justifique. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 95 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia Gráfico III Incidência da doença desconhecida segundo condições sanitárias, país X 100 so $ 60 g E 40 np o S Péssima Ruim Regular Boa Excelente Condições sanitárias Os autores desta fase da pesquisa chegaram a conclusão que uma bactéria cuja vetor seria encontrado em pulgas de rato, seria o responsável pela epidemia. Alguns anos depois, um segundo investigador começou a estudar o problema. Ele acreditava que a doença teria um componente nitidamente alimentar, baseado nas seguintes observações: * Pacientes internados em clínicas psiquiátricas apresentavam uma alta incidência da doença, apesar de médicos e Fisioterapeutas jamais se encontrarem infectados. * Jamais houve um caso sequer da doença entre o pessoal médico. Para comprovar sua hipótese, este investigador realizou os seguintes trabalhos : * Em um campo de prisioneiros, a uma parte dos detentos foi fornecida dieta suplementar, noutra a comida normal do presídio. Após algum tempo de observação, a incidência da doença, no grupo com dieta alterada, havia caído sensivelmente. * Utilizando urina, fezes, sangue e saliva de doentes, este médico fabricou uma solução, injetando-a em si próprio e em seus familiares. Ninguém apresentou a doença. Discussão final. AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 96 Universidade Federal do Rio de Janeiro Núcleo de Estudos em Saúde Coletiva (NESC) Saúde Coletiva - Fisioterapia No começo de setembro de 1959, na cidade de Meknés, Marrocos, um tecelão observou, ao despertar pela manhã, que não podia mover os braços nem as pernas. Nos dias anteriores, ele e também sua mulher haviam sentido dores nos músculos ao redor da escápula, braços e pernas, tendo entretanto estas dores desaparecido. Tratou de despertar sua mulher, que observou dificuldade semelhante em movimentar as extremidades. A paralisia aumentou durante o dia, e à noite, a mulher estava tão incapacitada quanto o seu marido. Na mesma semana, dezenas de outras famílias de Meknés — pais, mães ou filhos, muitas vezes famílias inteiras — foram igualmente afetadas. Ao redor de 18 de setembro, cerca de 200 casos eram relatados diariamente. Em dezembro o número de vítimas passava de 9000 e continuava aumentando. Para elucidar o problema, realizou-se um estudo que incluía um bairro com uma população de 10.000 habitantes. Nesse bairro, conviviam muçulmanos, cristãos e judeus de todas as classes sociais. Em cada grupo etário, 50% da população era masculina. Foram identificados 3.000 casos da doença nesta população (30%). 1) Porque foi estudado um bairro com as características acima descritas ? Os dados obtidos na coleta de dados poderão ser vistos nas tabelas Ia IV Tabela I- Número de casos segundo idade e sexo FAIXA ETÁRIA MASCULINO FEMININO 0-9 80 70 10 A 19 10 120 20 A 29 360 540 30 A 39 210 410 40 A 49 140 380 50 A 59 70 320 60 E+ 30 160 TOTAL 1000 2000 Tabela II - Número de casos segundo classe social CLASSE SOCIAL Nº DE CASOS NºDE HABITANTES ALTA 10 2000 MÉDIA 1100 3000 POBRE 1880 3000 MUITO POBRE 10 2000 TOTAL 3000 10000 Tabela III - Número de casos segundo religião RELIGIÃO Nº DE CASOS NºDE HABITANTES MUÇULMANOS 2600 4000 CRISTÃOS 400 4000 JUDEUS 0 2000 TOTAL 3000 10000 Tabela IV - Distribuição etária da população do bairro estudado FAIXA ETÁRIA POPULAÇÃO 0-9 2800 10 A 19 2000 20 A 29 1700 30 A39 1200 40 A 49 1000 50 A 59 700 60 E + 600 TOTAL 10000 AUTORIA: MAURÍCIO DE ANDRADE PÉREZ 97