Detecção sistemática de eventos adversos em farmacos comercializados

Detecção sistemática de eventos adversos em farmacos comercializados

(Parte 2 de 3)

Detecção Sistemática de Eventos Adversos em Fármacos Comercializados | 823

Estudos Ad Hoc

Muitas questões importantes em farmacoepidemiologia não podem ser resolvidas por esses métodos e, em vez disso, devem ser respondidas pela coleta de dados de novo sobre grupos específicos de pacientes que têm uma determinada doença ou usam uma classe específica de medicamentos. Um exemplo é a definição de sonolência súbita incontrolável (por vezes chamada de “crises de sono”) em pacientes com doença de Parkinson (DP) tratados com agonistas da dopamina. Esses eventos não foram documentados sistematicamente na maioria dos grandes ensaios clínicos desses fármacos nem tendem a ser registrados como um novo diagnóstico na consulta, e, para determinar se estão mais associados a alguns fármacos do que a outros, seria preciso entrevistar uma grande amostra de pacientes com DP que usassem diferentes classes de medicamentos.

Após a identificação de uma fonte de dados farmacoepidemiológicos, usam-se métodos estatísticos para avaliar esses dados e chegar a conclusões sobre as associações entre um fármaco e os possíveis efeitos adversos. A maioria dos dados colhidos para esse fim é de observação, e os dois tipos mais comuns de análises usadas para avaliá-los são estudos de coorte e estudos de caso-controle. Esses estudos destinam-se a avaliar estatisticamente o risco associado à exposição a um fármaco específico ou a um desfecho adverso particular.

Estudos de Coorte e Caso-Controle

Em estudos de coortes, identifica-se um grupo de pacientes expostos a um determinado fármaco (por ex., pacientes com artrite tratada com um AINE específico) e outro grupo de pacientes, o mais semelhante possível ao grupo exposto, que não usou o fármaco de interesse (por ex., pacientes com artrite de grau comparável tratada com outro AINE). Em seguida, os dois grupos são acompanhados para determinar quantos pacientes de cada um apresenta um efeito adverso de interesse (por ex., infarto do miocárdio; Fig. 50.1). Embora isso possa ser feito em tempo real, na maioria das vezes define-se a exposição (ou não-exposição) vários anos antes a partir de um banco de dados, de modo que os eventos subseqüentes possam ser analisados retrospectivamente, sem necessidade de espera para o acompanhamento. Os estudos de coortes são preferidos quando se deseja medir as taxas de incidência real (isto é, a probabilidade de um determinado desfecho após o uso de um fármaco específico).

Em estudos de caso-controle, especifica-se o desfecho que define o caso (por ex., infarto do miocárdio) e identifica-se um grupo de pacientes em uma população que já tenha apresentado aquele evento. Estes são os casos. Os controles são pacientes da mesma população, o mais semelhantes aos casos possível, mas que não apresentaram o desfecho de interesse (por ex., pacientes de idade e sexo semelhantes, com fatores de risco cardíaco semelhantes, que não tiveram infarto do miocárdio). Em seguida, faz-se a análise retrospectiva, revendo todos os medicamentos usados pelos casos e pelos controles, para determinar se o uso do fármaco foi maior entre os casos que entre os controles (Fig. 50.1). É mais difícil avaliar as taxas de incidência em um estudo de caso-controle do que em um estudo de coorte. No entanto, o modelo de caso-controle é mais eficiente se o desfecho de interesse for raro e for preciso entrevistar todos os participantes do estudo, porque é possível concentrar-se em um grupo selecionado de pacientes que de antemão se sabe que têm o desfecho de interesse.

Avaliação de Risco

No nível mais básico, os estudos de coorte e caso-controle oferecem dados que formam uma tabela 2 2, definida pela presença ou ausência de exposição ao fármaco de interesse, bem como pela presença ou ausência do desfecho adverso. Os dados podem ser organizados em quatro células, como mostra a Fig. 50.2: pacientes que usaram o fármaco de interesse e tiveram o desfecho (A); pacientes que usaram o fármaco, mas não tiveram o desfecho (B); pacientes que não usaram o fármaco, mas mesmo assim tiveram o desfecho (C), e pacientes que não usaram o fármaco nem tiveram o desfecho de interesse (D).

As células A e D são concordantes para a relação fármacodesfecho e as células B e C são discordantes para essa associação. Em termos simples, o produto A D dividido pelo produto B C reflete a importância dessa associação. Nos estudos de coorte, isso é denominado risco relativo; nos estudos de caso-controle (quando o desfecho do caso não é comum), é conhecido como razão de chances. Um risco relativo (ou razão de chances) igual a 2 significa que os pacientes que usam o fármaco são duas vezes

Estudo de caso-controle

Estudo de coorte (seguimento) Tempo

Tempo

= aquisição do fármaco X

= desfecho (por ex., infarto do miocárdio)

Casos (por ex., infarto do miocárdio)

Controles (sem infarto do miocárdio)

Expostos (em uso do fármaco X)

Não expostos (que não usam o fármaco X)

Fig. 50.1 Esquema de estudos de caso-controle e coorte. Em cima. Em um estudo de caso-controle, os casos são identificados como um grupo de pacientes em uma população que teve o evento definidor do caso (por ex., infarto do miocárdio) e os controles são pacientes da mesma população, o mais semelhantes aos casos possível, mas que não tiveram o desfecho de interesse. Todos os medicamentos usados pelos casos e pelos controles são revistos retrospectivamente para determinar se o uso do fármaco foi maior entre os casos que entre os controles. Embaixo. Em um estudo de coorte, são identificados dois grupos de pacientes — um grupo que foi exposto a um determinado fármaco e outro grupo, o mais semelhante possível ao grupo exposto, mas que não usa o fármaco de interesse. Os dois grupos são acompanhados para determinar quantos pacientes em cada um apresenta um desfecho de interesse específico (por ex., infarto do miocárdio).

824 | Capítulo Cinqüenta mais propensos a apresentar o desfecho que os pacientes que não usam aquele fármaco; um risco relativo ou razão de chances igual a 0,5 significa que o risco daquele desfecho nos usuários do fármaco corresponde à metade do risco dos não-usuários (isto é, o fármaco tem efeito protetor contra aquele desfecho).

Epidemiologistas e estatísticos criaram várias estratégias para corrigir os problemas inerentes aos estudos observacionais. Para evitar a maioria das formas de confundimento, os pesquisadores tentam obter o maior número possível de informações sobre as características de pacientes que usam cada fármaco estudado. Os pacientes que receberam um fármaco eram mais velhos do que os pacientes tratados com um fármaco comparador? Ou estavam mais enfermos? Ou havia maior probabilidade do uso (ou não uso) de outros medicamentos que poderiam influenciar a probabilidade de um desfecho? Por exemplo, em um estudo que compara as taxas de infarto do miocárdio nos pacientes em uso de rofecoxib (Vioxx) e em pacientes que usavam celecoxib (Celebrex), ibuprofeno (Motrin) ou que não usavam AINE, é desejável saber o máximo possível sobre a história de doença cardiovascular dos pacientes e também sobre fatores de risco cardíacos. Se essas características estiverem bem equilibradas nos “grupos” de usuários de diferentes fármacos, não devem causar problema. No entanto, em caso contrário (por exemplo, se entre os usuários de rofecoxib houver maior número de fumantes, ou menos usuários de doses profiláticas de aspirina, do que entre aqueles que usam celecoxib), seria preciso ajustar isso na análise.

Averiguação de Exposição ao Fármaco e Desfechos

Em um ensaio clínico, o fármaco usado pelo paciente é conhecido, porque é parte de um protocolo. Em um estudo obser- vacional, porém, o uso do fármaco deve ser determinado por outros meios. Um dos recursos mais importantes para verificar o uso de fármacos é a análise dos registros eletrônicos criados quando um paciente adquire um medicamento prescrito. No caso de pacientes com seguro-saúde, como Medicaid, cobertura de organização mantenedora de saúde, ou talvez Medicare, esses registros podem ser reunidos para oferecer um quadro completo e confiável de todos os medicamentos adquiridos pelo paciente.

Os arquivos computadorizados de uso dos serviços de saúde também podem ser empregados para avaliar desfechos, como fratura do quadril, infarto do miocárdio ou embolia pulmonar. Essas avaliações podem ser feitas com grande competência, pois esses diagnósticos também são registrados rotineiramente no decorrer da administração e do pagamento por serviços no sistema de saúde. Deve haver muito cuidado ao avaliar essas informações diagnósticas. Enquanto a aquisição de um suprimento de sinvastatina, 30 mg, para 30 dias é especificada sem ambigüidades no arquivo de farmácia, a presença (ou ausência) de um código indicativo de depressão, alergia ao fármaco ou insuficiência cardíaca pode representar uma variedade muito maior de diagnósticos. Alguns diagnósticos podem ser feitos com certeza a partir de dados computadorizados de solicitação de reembolso, como o reparo cirúrgico de uma fratura de quadril ou uma hospitalização por infarto do miocárdio. Outros podem exigir a validação de um diagnóstico computadorizado por revisão do prontuário médico. Esse problema diminuirá à medida que mais informações clínicas forem registradas eletronicamente e for possível o acesso direto ao “prontuário médico primário” no computador. Essas questões também causam menos problemas nos estudos farmacoepidemiológicos baseados principalmente na revisão do prontuário médico.

Confundimento por Indicação

Em um ensaio randomizado, o tratamento dos participantes é designado aleatoriamente. Se o estudo for grande o suficiente e a randomização adequada, é provável que as diferenças nos desfechos entre participantes nos diferentes braços de estudo sejam resultantes dos diferentes tratamentos recebidos, porque eles eram (por definição) semelhantes em todos os outros aspectos. Por outro lado, em um estudo observacional, o pesquisador é obrigado a analisar desfechos em pacientes para os quais o médico já decidiu prescrever o Fármaco A, o Fármaco B ou nenhum fármaco. Portanto, é preciso ir além da simples formulação 2 2 já descrita para ajustar as relações observadas e controlar essas diferenças — que podem ter existido antes de os pacientes usarem os fármacos estudados.

Por exemplo, um grupo de indivíduos que usam anti-hipertensivos tende a apresentar maior incidência de doença cardiovascular do que um grupo de indivíduos da mesma comunidade, com idade e sexo equivalentes, que não usam anti-hipertensivos. Sem dúvida, isso não ocorre porque os medicamentos para controle da pressão arterial causam doença cardíaca. Sabe-se que os anti-hipertensivos reduzem o risco de doença cardiovascular (inclusive insuficiência cardíaca, infarto do miocárdio e acidente vascular cerebral) em pacientes com hipertensão arterial. Esses medicamentos reduzem o risco de doença cardíaca, mas não o eliminam por completo. Além disso, muitos pacientes hipertensos iniciam o tratamento em uma idade mais avançada ou não seguem adequadamente o programa prescrito. Conseqüentemente, os usuários de medicamentos anti-hipertensivos têm uma maior incidência de doença cardíaca do que indivíduos idênticos do ponto de vista demográfico que não usam medicamentos para controle da pressão arterial. Esse problema é conhecido como “confundimento por indicação”.

Fig. 50.2 Análise básica de dados de estudos de caso-controle e coorte. A tabela 2 2 é definida pela presença ou ausência de exposição ao fármaco de interesse e também pela presença ou ausência do desfecho de interesse. As células de A a D incluem, respectivamente, pacientes que usaram o fármaco de interesse e tiveram o desfecho (A), pacientes que usaram o fármaco, mas não tiveram o desfecho (B), pacientes que não usaram o fármaco, mas mesmo assim tiveram o desfecho (C) e pacientes que não usaram o fármaco nem tiveram o desfecho de interesse (D). Em termos simples, o produto A D dividido pelo produto B C reflete a potência dessa associação fármacodesfecho. Nos estudos de caso-controle (visto que o desfecho do caso não é comum), essa razão é conhecida como razão de chances; nos estudos de coorte, essa razão é chamada de risco relativo.

Desfecho adverso

Exposição ao fármaco

Ausência de exposição ao fármaco

Exposição + Desfecho +

Exposição – Desfecho +

Exposição + Desfecho –

Exposição – Desfecho –

Ausência de desfecho adverso

Detecção Sistemática de Eventos Adversos em Fármacos Comercializados | 825

Viés de Seleção

Outro problema é causado pelo fato de que, em estudos epidemiológicos, o uso de fármacos pelos pacientes é determinado pelos médicos e não pelo observador. Por exemplo, quando a fluoxetina (Prozac) introduziu os antidepressivos da classe de inibidores seletivos da recaptação de serotonina (SSRI) no final da década de 1980, surgiram relatos de que os pacientes tratados com o novo fármaco eram mais propensos a cometer suicídio do que os pacientes que usavam antidepressivos antigos, como os antidepressivos tricíclicos (amitriptilina, nortriptilina, desipramina). Na verdade, ainda existe a preocupação (baseada em ensaios randomizados controlados por placebo) de que os SSRI possam precipitar idéias ou tentativas de suicídio em alguns pacientes, sobretudo em adolescentes e crianças. No entanto, os relatos iniciais de aumento do risco tornam claro que o viés de seleção poderia ser outra explicação para o suicídio em usuários de fluoxetina. Pacientes que estivessem apresentando bons resultados com os antidepressivos antigos seriam menos propensos a trocá-los pelo novo fármaco quando entrou no mercado. O ensaio de um novo medicamento teria um número muito maior de pacientes deprimidos que não tinham bons resultados — talvez aqueles que continuavam a pensar em suicídio. Além disso, a DL50 para os fármacos antigos é baixa por causa de sua toxicidade cardiovascular, ao passo que é muito mais difícil ingerir um SSRI em quantidade suficiente para que haja uma superdosagem fatal. Assim, o médico preferiria que um paciente potencialmente suicida tivesse em casa um suprimento de fluoxetina do que um suprimento de antidepressivos tricíclicos. Qualquer que seja o risco de suicídio causado por um desses fármacos, esses fatores isolados seriam combinados para criar um perfil de maiores índices de suicídio em usuários de fluoxetina em comparação com os usuários de antidepressivos tricíclicos em um estudo observacional.

O Efeito “Usuário Saudável”

Diversos estudos epidemiológicos de uso e desfechos de fármacos definiram relações que não foram confirmadas em ensaios controlados randomizados (por ex., diminuição das taxas de doença cardíaca, incontinência e depressão em mulheres que usam estrógeno após a menopausa; redução das taxas de câncer e doença de Alzheimer em pacientes que usam estatinas). Muitas vezes esses estudos parecem ser comprometidos pelo que pode ser chamado de “efeito do usuário saudável”. Os pacientes que são usuários regulares de qualquer medicação preventiva parecem ser diferentes daqueles que não exibem esse comportamento: são mais propensos a procurar o médico em busca de tratamento preventivo, ou pelo menos estão mais abertos a recebê-lo, e seus médicos costumam ser suficientemente interessados na prevenção para fazer tal prescrição. Talvez o mais importante seja que os pacientes que adquirem várias vezes um medicamento de forma regular e prolongada formam claramente uma minoria. É provável que também sejam mais propensos a ter outros comportamentos promotores da saúde, como não fumar, controlar o peso, praticar exercícios físicos e seguir as outras farmacoterapias prescritas.

Alguns grandes ensaios randomizados comprovaram um ponto semelhante: os pacientes que usam placebo e aderem ao programa do estudo têm menos eventos cardíacos do que os pacientes do grupo que recebe placebo e não aderem ao programa. Como o conteúdo do placebo não poderia ter causado esse efeito, os achados são sinais claros de que os pacientes que têm um comportamento regular de promoção da saúde são mais propensos a apresentar melhores desfechos clínicos, sem considerar o efeito terapêutico de um fármaco específico no seu programa. Para resolver essa questão em estudos observacionais, alguns grupos de pesquisa começaram a usar apenas “controles ativos” como grupos de comparação — comparando pacientes que aderiram ao uso de estatina aos pacientes que usavam outros fármacos profiláticos — em vez de apenas comparar esses pacientes com outros que não são usuários de estatinas.

Interpretação do Significado Estatístico

Na avaliação dos resultados de estudos observacionais e ensaios randomizados, costuma-se usar um valor de p de 0,05 como limiar ou referência de significado estatístico. Muitas vezes, esse critério é erroneamente interpretado como indicativo de que um achado é “real” se a diferença entre os grupos for menor que esse valor e “não-real” se estiver acima. No entanto, leitores mais sofisticados compreendem que esse ponto de corte é arbitrário (comparado, por exemplo, a um valor de p de 0,03 a 0,07), e que também se deve dar atenção à magnitude da diferença. Por exemplo, uma diferença de p < 0,05 entre um novo fármaco e o placebo pode ser clinicamente insignificante se houver apenas uma diferença de 2% na amplitude do efeito. Pode ser necessário, para fins reguladores (como a aprovação de um novo fármaco pela FDA), ter um nível de referência consensual de significado na comparação dos critérios de avalia ção de eficácia, mas deve-se compreender os limites desse recurso.

A situação é ainda mais crítica na avaliação do significado estatístico de dados sobre eventos adversos, seja em um ensaio randomizado ou em uma análise observacional. É útil lembrar que o valor de p é determinado pelo tamanho da amostra e pela magnitude de uma diferença observada. A maioria dos ensaios clínicos tem poder suficiente para detectar a diferença entre um fármaco em estudo e seu comparador na produção de um desfecho clínico relativamente comum (por ex., redução da pressão arterial ou do nível de LDL). Conseqüentemente, porém, esses estudos não tendem a ter poder estatístico adequado para encontrar uma diferença “significativa” entre os grupos acerca dos desfechos que são muito mais raros (por ex., redução da função renal). A adesão a um padrão “p < 0,05” para efeitos adversos raros pode levar à rejeição de riscos importantes que um estudo pode não ter o poder de detectar.

A solução não é incluir todas as diferenças nas taxas de efeitos adversos sem levar em conta suas propriedades estatísticas, mas sim avaliar atentamente essas diferenças e procurar outros dados para esclarecer relações preocupantes, mesmo que não sejam “significantes” em termos de valor de p. Por exemplo, quando a FDA estava avaliando o risco de pensamentos e atitudes suicidas em adolescentes e crianças que usavam antidepressivos do tipo SSRI em ensaios controlados por placebo, as taxas desses resultados relativamente raros costumavam ser maiores nos pacientes tratados do que no grupo que recebia placebo. Cada estudo individual não considerou um p < 0,05 significante para essas diferenças. Entretanto, quando a FDA reuniu os dados de todos esses ensaios (em alguns casos, anos após a conclusão dos estudos), ficou claro que a diferença em todos os estudos era clara e constante (e também atendia o nível de p < 0,05 convencional).

Observa-se o problema inverso quando se analisa o significado estatístico de dados de grandes estudos epidemiológicos populacionais. Aqui, o tamanho da amostra (poder) não é uma limitação, sobretudo quando os estudos usam dados sobre cen-

826 | Capítulo Cinqüenta tenas de milhares de pacientes mediante o emprego de um banco de dados automatizado de solicitações de reembolso. Uma diferença de 4 ou 5% nas taxas de um determinado efeito (seja terapêutico ou adverso) pode atingir um valor de p de 0,001, apenas devido ao enorme tamanho da população estudada. Mas aqui, mesmo que o achado pareça ter significado estatístico, uma diferença de magnitude tão pequena pode ter pouca ou nenhuma importância clínica.

A série de retiradas do mercado de fármacos freqüentemente usados na década de 1990 e no início da década de 2000 renovou o interesse no desenvolvimento de técnicas para evitar esses problemas, ou pelo menos para limitar o número de pacientes expostos ao risco identificando mais cedo os efeitos adversos. Conseqüentemente, o conceito de “gestão de risco” tornou-se um tema importante no desenvolvimento e na regulação dos fármacos.

(Parte 2 de 3)

Comentários