Sunday 11 December 2016

Arcsine Transformation In Stata Forex

Metaprop: um comando Stata para realizar meta-análise de dados binomiais As meta-análises se tornaram uma ferramenta essencial na síntese de evidências sobre questões clínicas e epidemiológicas derivadas de uma infinidade de estudos semelhantes que avaliam a questão em particular. É necessário um software estatístico apropriado e acessível para produzir a estatística de resumo de interesse. Métodos Metaprop é um programa estatístico implementado para realizar metanálises de proporções em Stata. Ele baseia-se ainda mais no procedimento Stata metan que é normalmente usado para reunir efeitos (razões de risco, odds ratios, diferenças de riscos ou meios), mas que também é usado para pool proporções. Metaprop implementa procedimentos que são específicos para binomial dados e permite a computação exata binomial e pontuação baseada em testes de confiança intervalos. Ele fornece métodos apropriados para lidar com proporções próximas ou nas margens onde os procedimentos normais de aproximação muitas vezes se decompõem, usando a distribuição binomial para modelar a variabilidade dentro do estudo ou permitindo a transformação de arcseno duplo de Freeman-Tukey para estabilizar as variâncias. Metaprop foi aplicado em duas metanálises publicadas: 1) prevalência de infecção por HPV em mulheres com citologia de Papanicolaou mostrando ASC-US 2) taxa de cura após tratamento para precanceros cervicais usando coagulação a frio. Resultados A primeira meta-análise mostrou uma prevalência combinada de HPV de 43 (95 IC: 38-48). Na segunda metanálise, o percentual agrupado de mulheres curadas foi 94 (95 IC: 86-97). Conclusão Usando metaprop. Nenhum estudo com 0 ou 100 proporções foi excluído da meta-análise. Além disso, os intervalos de confiança de estudo específicos e agrupados sempre estavam dentro de valores admissíveis, contrariamente à publicação original, onde metan foi usado. Palavras-chave Meta-análise Stata Binomial Logística-normal Intervalos de confiança Freeman-Tukey dupla transformação do arcsine As metanálises de fundo combinam informações de múltiplos estudos para derivar uma estimativa média. Existem diferentes procedimentos de metanálise, dependendo da estatística a ser relatada. Exemplos de estatísticas de interesse incluem medidas de associação como diferença de risco, razão de risco, odds ratio, diferença de médias, ou simplesmente binômio unidimensional ou medidas contínuas, tais como proporções ou meios. Existem três aspectos importantes na meta-análise: a) o quadro de análise, b) o modelo e c) a escolha do método para estimar o parâmetro de heterogeneidade. Esses aspectos interagem uns com os outros. Um meta-analista tem uma escolha entre o modelo de efeitos fixos e aleatórios. No modelo de efeitos fixos, assume-se que o parâmetro de interesse é idêntico entre os estudos ea diferença entre a proporção observada ea média é apenas devido ao erro de amostragem. No modelo de efeitos aleatórios, a diferença observada entre as proporções e a média não pode ser inteiramente atribuída ao erro de amostragem e outros fatores como diferenças na população do estudo, desenhos de estudo, etc. também poderiam contribuir. Cada estudo estima um parâmetro diferente, ea estimativa agrupada descreve a média da distribuição dos parâmetros estimados. O parâmetro de variância descreve a heterogeneidade entre os estudos e no caso em que a variância é zero, este modelo simplesmente se reduz ao modelo de efeitos fixos. Há três frameworks na modelagem de dados binomiais. A estrutura mais popular usa aproximação para a distribuição normal por meio de transformações e é conhecida como aproximação aproximada de verossimilhança. Algumas das transformações comuns incluem o logit eo arcsine 3. Algumas das razões pelas quais esta abordagem é popular incluem o menor nível de experiência necessária estatística, cálculos mais rápidos e disponibilidade de software para realizar a análise. A segunda abordagem reconhece a verdadeira natureza dos dados e é conhecida como abordagem de verossimilhança exata. Neste quadro, a relação especial entre a média e a variância caracterizada por dados binomiais é captada pela distribuição binomial 4. A distribuição beta-binomial 5 pode ser usada para ajustar um modelo de efeitos aleatórios de modo que a distribuição beta descreve a distribuição dos vários parâmetros binomiais. Embora seja possível realizar cálculos para estimar os parâmetros do modelo binomial, o software estatístico mais comum carece de função para se ajustar ao modelo beta-binomial e, portanto, essa abordagem é a menos popular. O software WinBUGS, um pacote de software para estatísticas bayesianas, tem a capacidade de realizar tais análises. Outros softwares, por exemplo R e SAS (PROC NLMIXED) também podem ser usados, mas uma programação extensa é necessária. A terceira abordagem é um compromisso entre probabilidade aproximada e exata. Na primeira etapa, os dados são modelados usando a distribuição binomial. Na segunda etapa, a distribuição normal é utilizada após a transformação logit para modelar a heterogeneidade entre os estudos. Esta é uma abordagem emergente e é frequentemente recomendada pelos estatísticos 4. A maioria dos softwares estatísticos, incluindo Stata (melogit), R, SAS (PROC NLMIXED) têm a capacidade de realizar tais análises. Há três métodos populares para estimar os parâmetros. O método não-iterativo popularizado por Dersimonian e Laird 6. Os outros dois métodos são o método de máxima verossimilhança (ML) e restrito de máxima verossimilhança (REML). Para o modelo de efeitos aleatórios, o método REML é preferido porque ML leva à subestimação do parâmetro de variância. Para os modelos mistos lineares generalizados 2. 7. 8 sob os quais os modelos para dados binomiais caem, o método REML não é utilizado devido à computação intensiva de integrações de alta dimensão dos efeitos aleatórios e como resultado a maioria estimativa de software o parâmetro de heterogeneidade usando ML métodos. O procedimento proposto por Dersimonian e Laird é eficiente para a média, mas não o parâmetro de heterogeneidade 9. Vários procedimentos para realizar a metanálise foram implementados no comando de Stata metan 10. Em metan. Os intervalos de confiança são calculados utilizando a distribuição normal com base na variância assintótica. Para proporções, tais intervalos podem conter valores inadmissíveis, especialmente quando a estatística está próxima do limite. Além disso, o cálculo dos intervalos de confiança não é possível quando a estatística está na fronteira, uma vez que o erro padrão estimado é definido como zero e, como consequência, o comando metan exclui automaticamente estudos com proporção igual a 0 ou 1 a partir do cálculo da concentração estimativa. Testes de significância sobre a proporção agrupada tipicamente dependem de probabilidades normais. As proporções (p r n) são binomiais ea distribuição normal é uma boa aproximação da distribuição binomial se n é suficientemente grande e p não está próximo das margens 11. Quando n é pequeno e / ou p está perto das margens, a estatística do teste pode não ser aproximadamente distribuída normalmente devido a sua skewness e discreteness. Para tornar as suposições de distribuição normal mais aplicáveis ​​ao teste de significância, várias transformações foram sugeridas. Freeman e Tukey 12 apresentaram uma transformação de arco duplo para estabilizar a variância. Desenvolvemos metaprop. Um novo programa em Stata para realizar meta-análises de dados binomiais para complementar o comando metan, que é normalmente usado para agrupar associações. Metaprop constrói mais sobre o procedimento metan. Permite a computação de 95 intervalos de confiança usando a estatística de pontuação eo método binomial exato e incorpora a transformação de proporções de arcsina dupla de Freeman-Tukey. O programa também permite que a variabilidade dentro do estudo seja modelada usando a distribuição binomial. Este artigo apresenta uma visão geral do programa para servir de ponto de partida para os usuários interessados ​​em realizar meta-análise de proporções no software Stata. Métodos Uma descrição detalhada de vários procedimentos estatísticos para realizar meta-análise que pode ser realizada com metan pode ser encontrada em outro lugar 10. Neste artigo, apresentamos procedimentos específicos para o agrupamento de dados binomiais, incluindo métodos de computação dos intervalos de confiança, continuidade correta e a transformação de Freeman-Tukey. A Tabela 1 resume as características dos procedimentos apresentados. Resumo dos procedimentos disponíveis na metaprop Os intervalos de confiança para os estudos individuais Foram implementados dois tipos de intervalos de confiança para as proporções específicas do estudo. Ao longo do texto, para o estudo i. R i denota o número de observações com uma certa característica, n i é o número total de observações, p i r i n i é a proporção observada, k é o número total de estudos na meta-análise e 1 - refere-se ao nível de confiança selecionado. Intervalos de confiança exatos Os limites de confiança exatos ou de Clopper-Pearson 13 para uma proporção binomial são construídos invertendo o teste de igualdade com base na distribuição binomial. P X i r i 2 e P X i r i 2 para X i 0. 1. r i. . N i. O ponto final inferior é o quantile 2 de uma distribuição beta beta (x i, n i - x i 1) eo ponto final superior é o quantile 1 - 2 de uma distribuição beta beta (x i 1, n i - x i) 14. Como a distribuição binomial é discreta, a probabilidade de cobertura dos intervalos exatos não é exatamente (1-), mas pelo menos (1-) e consequentemente os intervalos de confiança exatos são considerados conservadores 15. Intervalos de confiança de pontuação O intervalo de confiança de pontuação 16 tem a sua cobertura perto do nível de confiança nominal, mesmo com pequenos tamanhos de amostra. Demonstrou-se que tem um desempenho melhor do que o Wald e os intervalos de confiança exatos 1. 15. Os limites de confiança para o i ésimo estudo são calculados como p i z 2 n i z p i (1 - p i) z 4 n i n i 1 z n i. Onde z é o 2º percentil da distribuição normal padrão. A transformação estabilizadora da variância das proporções, tal como proposta por Freeman e Tukey 12, normalizando os resultados antes do agrupamento, é definida como sin - 1 rini 1 sen - 1 ri 1 ni 1. A variância assintótica da variável transformada é definida como 1 ni 0,5. Estas transformações visam atingir a normalidade aproximada. A estimativa agrupada é então calculada usando o método de Dersimoniano e Laird 6 com base nos valores transformados e suas variâncias. Os intervalos de confiança para a estimativa agrupada são então calculados usando o método de Wald. Inversão da transformação de arcsine dupla de Freeman-Tukey Para converter os valores transformados em unidades originais de proporções, Miller 3 propôs a seguinte fórmula p 1 2 1 - sinal (cos t) 1 - sin t sin t - 1 sen tn 2. onde t É o valor transformado e n é o tamanho da amostra. No cenário de meta-análise, t é a estimativa agrupada ou os intervalos de confiança baseados em valores transformados. Na prática, o uso desta fórmula geralmente envolve traduzir os meios de t s derivados de binômios com diferentes n s como é o caso na meta-análise onde a maioria dos estudos incluídos têm diferentes tamanhos de amostra. Neste caso, Miller 3 sugeriu que a média harmônica dos n i s ser usada na fórmula de conversão. Para um conjunto de números, a média harmônica é o inverso da média aritmética dos recíprocos dos números no conjunto. O modelo logístico-normal de efeitos aleatórios Os eventos observados r i assumem-se como tendo uma distribuição binomial com parâmetros p i e tamanho da amostra n i. I. e r i binomial (p i. n i). A distribuição normal é então usada para modelar os efeitos aleatórios logit (p i) normal (.). Aqui, é a média de uma população de meios possíveis, e é a variância entre estudos, tanto na escala logit. O procedimento de máxima verossimilhança (ML) é aqui utilizado para estimar. O modelo acima pode ser reduzido para formar o modelo de efeitos fixos assumindo que 0. Neste caso, o modelo é escrito como r i binomial (p. n i). Materiais Os dados utilizados para a ilustração foram parte de meta-análises conduzidas por Arbyn et al. 17 e Dolman et ai. 18. Os conjuntos de dados estão disponíveis como exemplos clicáveis ​​no arquivo de ajuda para metaprop. Dataset um Arbyn et al. 17 avaliaram a taxa de positividade do teste de HPV em mulheres com anormalidades citológicas cervicais equívocas ou de baixo grau. O teste de HPV tem sido proposto como um método para triagem de mulheres com pequenas anormalidades citológicas identificadas através de rastreio para câncer de colo do útero usando o esfregaço Pap. 19,20. A prevalência de infecção pelo HPV reflete o peso do encaminhamento e do diagnóstico quando o teste é utilizado para triagem de mulheres com essas condições citológicas 17. Podem distinguir-se dois grupos de anormalidades citológicas menores: a) células escamosas atípicas de significado indeterminado (ASC-US) ou discariíase limítrofe e b) lesão intraepitelial escamosa de baixo grau (LSIL) ou discariose leve. A meta-análise concluiu que a grande maioria das mulheres com LSIL estavam infectadas com HPV sugerindo utilidade limitada de HPV triagem. No entanto, para as mulheres com ASC-US, mais de metade testado negativo e poderia ser liberado de follow-up. A Figura 1 reproduz a meta-análise incluindo 32 estudos que fornecem dados de infecção por HPV em caso de citologia cervical equívoca (ASC-US). A prevalência combinada de infecção por HPV, avaliada pelo ensaio Hybrid Capture 2, foi de 43 (95 CI: 39-46) (ver Figura 1 e Tabela 2). Metanálise da proporção de mulheres com ASCUS ou um esfregaço de Papanicolaou borderline que tenham um teste Hybrid Capture II positivo. Saída gerada pelo método Stata metaprop. Meta-análise da presença de DNA de HPV de alto risco em mulheres com citologia cervical equívoca, por grupo terminológico (ASCUS, Dyskaryosis Borderline ou ASC-US) Produção gerada pela metapropática Stata. O conjunto de dados contém autor e ano que identificam cada estudo, onde tgroup corresponde com o grupo de triagem (ASCUS, LSIL, diskaryosis borderline). Num e denom indica o número de mulheres com um teste de HPV positivo (ensaio de HC2) eo número total de mulheres testadas, tal que frac num denom é a proporção com um teste de HC2 positivo. Se indica o erro padrão calculado como frac (1 - frac) denom. Lo e up são os intervalos de confiança inferior e superior calculados usando o método exato. Conjunto de dados dois Dolman et al. 18 publicaram uma revisão sistemática sobre a eficácia da coagulação a frio no tratamento da neoplasia intra-epitelial cervical (NIC). Treze relatos foram incluídos na meta-análise, que mostrou um alto grau de heterogeneidade entre os estudos. Vários estudos tiveram taxas de cura próximas ou próximas de 100. Como visto na Figura 2, os intervalos de confiança de Wald produzem valores para além de 1 para alguns dos estudos individuais e para a proporção agrupada para estudos realizados na Europa. Proporção-curado estimativas associadas com frio coagulação tratamento para CIN1 doença, por região do mundo como analisado por metan. O conjunto de dados contém nbcured e nbtreated indica o número de mulheres curadas de CIN e número total de mulheres tratadas para CIN tal que fra nb curado nb tratado é a proporção de mulheres curadas de CIN, e se é o erro padrão. Região indica continente em que o estudo foi realizado. Para estudos com frac 1, se 0 e os autores substituíram se u p baixo 2 1,96. Onde para cima e para baixo foram os intervalos de confiança binomiais exatos para garantir que tais estudos não foram excluídos da análise. Desenvolvimento de software O comando metaprop é uma adaptação do programa metan desenvolvido por Harris et al. 10 pretendia realizar meta-análise de efeitos fixos e aleatórios em Stata sobre variáveis ​​contínuas ou associações entre variáveis ​​contínuas ou binomiais. O programa de metaprop e seu arquivo de ajuda estão disponíveis para download em ideas. repec. org/c/boc/bocode/s457781.html. O comando requer Stata 10 ou versões posteriores e pode ser instalado diretamente no Stata digitando ssc instalar metaprop quando um está conectado à Internet. Uma atualização para metaprop para incluir o modelo logístico-normal de efeitos aleatórios também está disponível para download. O comando atualizado metapropone requer Stata 13 e pode ser instalado diretamente no Stata digitando ssc install metapropone quando um está conectado à internet. Resultados Exemplo 1 Reproduzimos a Figura 1 em Arbyn et al. 17. Metaprop pools proporções e apresenta um sub-grupo ponderado e geral combinado estimativas com inversa-variância pesos obtidos a partir de um modelo de efeitos aleatórios. (Citologia), (4)) / Tabela 2 e Figura 1 apresentam ambas as proporções específicas do estudo com 95 Os intervalos de confiança exatos para cada estudo, o subgrupo ea estimativa global agrupada com 95 intervalos de confiança de Wald e a estatística de I 2 que descreve a percentagem da variação total devido à heterogeneidade entre estudos. A tabela apresenta informações adicionais sobre as proporções agrupadas e inclui testes de heterogeneidade dentro dos subgrupos e no geral. Houve heterogeneidade significativa intragrupo (p lt0.001 com I 2 superior a 93 para todos os três grupos terminológicos). No entanto, não foi observada heterogeneidade inter-grupo (p 0,925), apoiando o agrupamento de todos os estudos em uma única medida: 43 (95 CI: 39-46). Embora os pesos tenham sido calculados usando o modelo de efeitos aleatórios, as estatísticas de heterogeneidade foram calculadas recalculando a estimativa agrupada global tratando as estimativas agrupadas do subgrupo como se fossem estimativas de efeitos fixos. Uma vez que todas as proporções específicas do estudo são próximas de 0,5, metan (ver Figura 1 em Arbyn et al.17) e metaprop (ver Figura 1) produzem resultados semelhantes. Exemplo dois Extraímos os dados que geraram a Figura 2 em Dolman et al. 18 (ver Figura 2). Uma vez que a proporção de mulheres curadas é próxima ou em 1 em alguns estudos, permitimos a transformação de arcsine dupla Freeman-Tukey. Caso contrário, os estudos com uma proporção estimada em 1 seriam excluídos da análise levando a uma estimativa parcial e parcial. Alternativamente, usando cc () garante que tais estudos não são excluídos. No entanto, a estimativa agrupada não é garantida para estar dentro do intervalo 0,1 que é automático quando a opção Freeman-Tukey dupla arcsina (ftt) é habilitado. Utilizamos os intervalos de confiança de pontuação para os estudos individuais. Metaprop nbcured nbtreated, random por (região) ftt cimethod (pontuação) / / label (estudo namevar) graphregion (cor (branco)) plotregion (cor (branco)) / / xlab (0.5.0.6, .7,0.8, 1) / / xtick (0,5,0,6, .7,0,8, 0,9, 1) força / / xtitle (Proporção, tamanho (2)) nowt stats / / olineopt (lcolor (preto) lpattern (shortdash)) / / diamopt A Figura 3 (exibindo o enredo florestal gerado pela metaprop) apresenta as proporções específicas do estudo com 95 pontuação (s) Intervalos de confiança, as estimativas agrupadas regionais e globais com 95 intervalos de confiança Wald, I 2 estatística e teste de significância das estimativas agrupadas globais. Em contraste com a Figura 2 (exibindo a saída gráfica gerada com metan), todos os intervalos de confiança têm valores admissíveis. Proporção de curado estimativas associadas com frio coagulação tratamento para CIN1 doença, por região do mundo como analisado por metaprop. Exemplo três Extraímos dados que geraram a Figura 2 em Dolmanet al. 18 (ver Figura 2). Nós ajustamos o modelo logístico-normal de efeitos aleatórios aos dados. Com esses modelos, não há preocupação com estudos com taxas de cura próximas a ou em 1 em alguns estudos, uma vez que usamos o método exato. Os intervalos de confiança para os estudos individuais também são calculados com o método exato. Usamos o comando atualizado metapropone, que requer que o Stata 13 encaixe o modelo linear linear (GLMM). Metaproposta nbcured nbtreated, aleatório logit groupid (estudo) /// rótulo (nomevar autor, yearvar ano) sortby (ano autor) /// xlab (.1, .2, .3, .4, .5, .6 ,. 7, .8, .9,1) xline (0, lcolor (preto)) /// ti (Positividade de p16 imunocoloração, tamanho (4) cor (azul)) /// subti (Citologia HSIL, Cor (azul)) /// xtitle (Proporção, tamanho (3)) nowt nostats /// olineopt (lcolor (vermelho) lpattern (shortdash)) /// diamopt (lcolor (vermelho)) pointopt (msymbol (s) msize (100) A tabela 3 apresenta as proporções específicas do estudo com 95 intervalos de confiança exatos e estimativas agrupadas globais com 95 intervalos de confiança de Wald com transformação de logit e transformação de volta, estatística de probabilidade de C hi 2 (LR) comparando o modelo de efeitos aleatórios e fixos, a variância estimada entre os estudos eo teste de teste de significância se a proporção estimada for igual a zero. O valor P para o LR é 0,022 indicando presença de heterogeneidade significativa. A partir do comando anterior, a Q-estatística é análoga à estatística LR. Em contraste com a Figura 2 (exibindo a saída gráfica gerada com metan), todos os intervalos de confiança têm valores admissíveis. A média agrupada estimada e os correspondentes intervalos de 95 são semelhantes aos obtidos anteriormente (ver Figura 2) calculados como uma média ponderada após a transformação do arsénico. Entretanto, a variância estimada entre os estudos é maior (0,4907) do que a estimativa da variância de Dersimoniano e Laird obtida a partir do comando anterior (0,0409) como esperado 9. Meta-análise da proporção de presença de mulheres curadas de doença CIN1 com coagulação fria) Teste LR: RE vs FE Modelo chi 2 4,04 (d. f. 1) p 0,022. Estimativa da variância entre estudos Tau 2 0,4907. Ensaio de ES0 z 45,56 p 0,000. Saída gerada pelo procedimento Stata metapropone. Discussão Apresentamos procedimentos para realizar meta-análise de proporções em Stata. Adaptamos e fizemos adições ao comando metan para fornecer procedimentos que são específicos para dados binomiais onde o usuário especifica n e N indicando o número de indivíduos com a característica de interesse eo número total de indivíduos. Com metaprop. Ï¿½poss�el realizar um teste de heterogeneidade entre os grupos quando a an�ise de subgrupo for desejada e o modelo de efeitos aleat�ios tiver sido utilizado para calcular a estimativa agrupada. Em metan, um teste de comparação intergrupal só é produzido quando o modelo de efeitos fixos é usado em uma meta-análise de subgrupo. Quando a proporção estimada está em 0/1, a estimativa para o erro padrão é zero e, portanto, os intervalos de confiança Wald não podem ser calculados. Estudos com erro padrão zero são freqüentemente excluídos, uma vez que o peso atribuído a esses estudos é infinito. A exclusão de tais estudos pode levar a resultados tendenciosos e, muitas vezes, os usuários calculam o erro padrão de maneira ad hoc. A correção de continuidade habilitada pela opção cc () evita a exclusão de estudos com prevalência de 0 ou 100. Embora isso garanta que os estudos são mantidos, os intervalos de confiança para a estimativa agrupada pode gerar valores inadmissíveis. Além disso, a utilização dos intervalos de confiança de Wald para os estudos individuais quando a proporção estimada é próxima de zero frequentemente produz valores inadmissíveis. Isso ocorre porque os intervalos de confiança Wald são sempre simétricos em torno de uma estimativa. Em contraste com o Wald, os intervalos de confiança exata ou de pontuação podem ser assimétricos, especialmente perto dos valores extremos. Ao computar os intervalos de confiança exatos ou pontuação para os estudos de indivíduos, estamos garantidos de valores admissíveis. Embora a confiança exata seja considerada como o padrão-ouro, recomendamos o uso de intervalos de confiança de pontuação porque a cobertura é próxima ao nível nominal, enquanto a cobertura é sempre maior do que o nível nominal para o método exato. Usando a transformação de arcsina dupla de Freeman-Tukey, todos os estudos são mantidos, além disso, temos a garantia de ter intervalos de confiança admissíveis para cada estudo individual, bem como para a proporção agrupada. Embora a distribuição da estatística de arcsine dupla de Freeman-Tukey seja mais normal para dados escassos, o procedimento se divide com dados extremamente esparsos e deve, portanto, ser usado com cautela 21. Sempre que possível, o uso de métodos exatos é mais recomendado para dados binomiais. À medida que o tamanho da amostra aumenta e quando as proporções não são extremas, os métodos baseados em dados transformados e métodos exactos dão resultados semelhantes aos métodos aproximados. Conclusão metaprop permite epidemiologistas para pool proporções em Stata, evitando problemas encontrados com metan. Metaprop permite a inclusão de estudos com proporções iguais a zero ou 100 por cento, evitando intervalos de confiança que excedam o intervalo de 0 a 1. O modelo logístico-normal de efeitos aleatórios atrai os usuários um passo mais perto do uso de métodos exatos recomendados para dados binomiais. Declarações Agradecimentos Foram recebidos apoios financeiros de: (1) o 7º Programa-Quadro da DG Investigação da Comissão Europeia através da Rede COHEAHR (subvenção 603019, coordenada pela Vrije Universiteit Amsterdam, Países Baixos) eo projecto HPV-AHEAD - HEALTH-2011-282562, coordenado pelo IARC, Lyon, França) (3) Instituto Científico de Saúde Pública (Bruxelas, através do projecto OPSADAC). Autores originais arquivos enviados para imagens Abaixo estão os links para os autores originais arquivos enviados para imagens. Interesses concorrentes Os autores declaram que não têm interesses concorrentes. Contribuições dos autores VN escreveu o programa de metaprop em Stata, analisou os dados e redigiu o manuscrito. MA conceitualizou e iniciou o projeto e editou o manuscrito. MA editou o manuscrito. Todos os autores revisaram e aprovaram o manuscrito final. Autores Afiliações Unidade de Câncer Epidemiologia, Instituto Científico de Saúde Pública Centro de Estatística, Universidade de Hasselt Referências Agresti A, Coull BA: Aproximado é melhor do que exato para a estimativa de intervalo de proporções binomiais. Am Stat. 1998, 52 (2): 119-126. Google Scholar Breslow NE, Clayton DG: Inferência aproximada em modelos lineares generalizados generalizados. J Am Stat Assoc. 1993, 88: 9-25. Google Scholar Miller JJ: O inverso da transformação de arcsine dupla de Freeman-Tukey. Am Stat. 1978, 32 (4): 138- Google Scholar Hamza TH, van Houwelingen HC, Stijnen T: A distribuição binomial da meta-análise foi preferida ao modelo dentro da variabilidade do estudo. J Clin Epidemiol. 2008, 61: 41-51. 10.1016 / j. jclinepi.2007.03.016. Ver artigo principal: Molenberghs G, Verbeke G, Iddib S, Demtrio CGB: Um modelo combinado de efeitos aleatórios e beta para dados binários e binários repetidos e dispersos. J Multivar Anal. 2012, 111: 94-109. Ver artigo Google Scholar DerSimonian R, Laird N: Meta-análise em ensaios clínicos. Control Clin Trials. 1986, 7: 177-188. 10.1016 / 0197-2456 (86) 90046-2. Engel E, Keen A: Uma abordagem simples para a análise de modelos lineares generalizados generalizados. Stat Neerl. 1994, 48: 1-22. 10.1111 / j.1467-9574.1994.tb01428.x. Ver artigo Google Acadêmico Molenberghs G, Verbeke G, Demtrio CGB, Vieira AMC: Família de modelos lineares generalizados para medidas repetidas com efeitos aleatórios normais e conjugados. Stat Sci. 2010, 3: 325-347. Ver artigo Google Acadêmico Jackson D, Bowden J, Baker R: Como é que o Dersimonian e Laird procedimento para efeitos aleatórios meta-análise comparar com o seu mais eficiente, mas mais difícil de calcular contrapartes. J Estatística Inferência do Plano. 2010, 140: 961-970. 10.1016 / j. jspi.2009.09.017. Ver artigo Google Harris Harris R., Bradburn M, Deeks J, Harbord R, Altman D, Sterne J: metan: meta-análise de efeitos fixos e aleatórios. Stata J. 2008, 8 (1): 3-28. Google Scholar Caixa GEP, Hunter JS, Hunter WG: Estatísticas para experimentadores. 1978, Hoboken (NJ), EUA: J Wiley amp Sons Inc, Série Wiley em Probabilidade e Estatística Google Scholar Freeman MF, Tukey JW: Transformações relacionadas com a raiz angular e quadrada. Ann Math Estatísticas. 1950, 21 (4): 607-611. 10.1214 / aoms / 1177729756. Ver artigo Google Scholar Clopper CJ, Pearson ES: O uso de limites de confiança ou fiduciais ilustrado no caso do binômio. Biometrika. 1934, 26 (4): 404-413. 10.1093 / biomet / 26.4.404. Ver artigo Google Acadêmico Brown LD, Cai TT, DasGupta A: Estimativa de intervalo para uma proporção binomial. Stat Sci. 2001, 16: 404-413. Google Scholar Newcombe RG: Intervalos de confiança de dois lados para a única proporção: comparação de sete métodos. Stat Med. 1998, 17: 857-872. 10.1002 / (SICI) 1097-0258 (19980430) 17: 8lt857 :: AID-SIM777gt3.0.CO2-E. Ver artigo PubMed Google Scholar Wilson EB: inferência provável, a lei da sucessão e inferência estatística. J Am Stat Assoc. 1927, 22 (158): 209-212. 10.1080 / 01621459.1927.10502953. Ver: 1 Arbyn M, Martin-Hirsch P, Buntinx F, Ranst MV, Paraskevaidis E, Dillner J: Triagem de mulheres com citologia cervical equívoca ou de baixo grau resultados uma meta-análise da taxa de positividade de teste hpv. J Cell Mol Med. 2009, 13 (4): 648-659. 10.1111 / j.1582-4934.2008.00631.x. Sankaranarayanan R: Meta-análise da eficácia da coagulação fria como um método de tratamento para neoplasia intra-epitelial cervical: uma revisão sistemática. BJOG. 2014, 121: 929-942. 10.1111 / 1471-0528.12655. Ver artigo PubMed Google Acadêmico Arbyn M, Ronco G, Anttila A, Meijer CJLM, Poljak M, Ogilvie G, Koliopoulos G, Naucler P, Sankaranarayanan R, Petok J: Evidências sobre papilomavírus humano testes na prevenção secundária de câncer cervical. Vacina. 2012, 30 (Supl. 5): F88-F99. Teste de papilomavírus humano versus citologia de repetição para a triagem de pequenas lesões citológicas cervicais. (AU) LILACS Cochrane Database Syst Rev. 2013, 3 (CD008054): 1-201. Google Scholar Westfall PH, Young SS: Teste múltiplo baseado em resampling: exemplos e métodos para ajuste do valor P. 1993, Hoboken (NJ), EUA: John Wiley amp Sons Google Acadêmico Copyright Nyaga et al. Licenciado BioMed Central Ltd. 2014 Este artigo é publicado sob licença para BioMed Central Ltd. Este é um artigo de Acesso Aberto distribuído sob os termos da Creative Commons Attribution License (creativecommons. org/licenses/by/4.0), que permite o uso irrestrito, Distribuição e reprodução em qualquer meio, desde que a obra original seja apropriadamente creditada. A licença de Dedicação de Domínio Público Creative Commons (creativecommons. org/publicdomain/zero/1.0/) se aplica aos dados disponibilizados neste artigo, a menos que indicado de outra forma. Como posso aplicar uma transformação de arcseno para meus dados usando Statistica Ive tem uma variável binária . 0 eles usaram algo que não fizeram, então eu tenho uma pontuação total de 8 tentativas para cada criança e eu originalmente realizou uma ANOVA nas pontuações (que eu realmente transformado em percentagens de uso). Um revisor está certo em me dizer que por causa da codificação binária original, eu não respeito a condição de distribuição normal e Ive tenho que aplicar uma transformação de arcseno para os meus dados. Qualquer idéia de como fazê-lo. Tópicos Neil, não confunda termos, por favor. Os dados não são nem paramétricos nem não paramétricos. Sua métrica ou categorial. 0/1 is categorial, more specifically dichotomous. Logistic regression is not a non-parametric method. It puts strict assumptions on the data, especially, the residuals must be binomially distributed. And, it estimates linear parameters (on a logit scale). Catherine, please follow the advice of the others and use logistic regression. Setting up the model and interpretation is straight forward if you are familiar with classic linear models. The only issue to understand is that parameters are on a logit scale. This sort of stretches your 0/1 response to - Inf, Inf. In order to obtain estimated group means (or slopes in case of cont. predictors), you have to apply the logistic transformation (which happens to be the inverse of the logit): logist(B) exp(B) / (1 exp(B)) So, assuming you have a simple design with two groups. You may get something like beta (Intercept) 1.2 group2 0.4 This means your first group has an estimated group means of logist(1.2) 0.77 whereas the second has logist(1.2 0.4) 0.83 Note that you dont have to transform your response variable in any way. Also note that all linear combinations of the estimates must be done before the logistic transformation. This ensures that you cant get predictions outside the range 01. You can do the same thing for confidence limits. Im not sure whether there is any way to interpret estimates after arcsine transformation. Another difference to linear models is that the F-test does not apply. You can resort to either the Wald test or the Likelihood Ratio test. Should be part of the output of your program and is reported in much similar way. If you have a number of trials per subject, there are two more things to take care for: First, you have to make the number of trials known to the program. This can even vary by subject or group. Im not using Statistica myself, so you have to refer to the manual. Second, as I said above, the logistic regression has strict assumptions, one of them being that the residual variance is exactly np(1-p). Typically, the residual variance is larger, which is then called overdispersion. My advice: Run a quasi-logistic regression. This is about the same thing, but confidence limits are inflated by the amount of overdispersion. For a quick tutorial of how to do logistic regression and report it: Peng, C.-Y. J. Lee, K. L. and Ingersoll, G. M. An Introduction to Logistic Regression Analysis and Reporting. The Journal of Educational Research 96, 1 (2002), 3ndash14. A very comprehensive (digestible, yet) treatment: Hilbe, J. M. Logistic regression models. CRC Press, Boca Raton, FL, 2009. Got a question you need answered quicklyThe metafor Package Based on some code I wrote as part of my dissertation research, I developed a function called mima() which provided the basic functionality for fitting fixed - and random/mixed-effects (meta-regression) models. Around 2006, I placed the function on my website (together with a short tutorial) and it was picked up by several researchers who used the function successfully in several meta-analyses. However, while the mima() function provided the basic functionality for fitting standard meta-analytic models and conducting meta-regression analyses, the metafor package was written in response to several requests to expand the function into a full package for conducting meta-analyses with additional options and support functions. The mima() function is therefore now obsolete and has been removed from my website. Various attempts have been made to validate the functions in the metafor package. First of all, when corresponding analyses could be carried out, I have compared the results provided by the metafor package with those provided by other software packages for several data sets. In particular, results have been compared with those provided by the metan. metareg. metabias. and metatrim commands in Stata (for more details on these commands, see Sterne, 2009). Results were also compared with those provided by SAS using the proc mixed command (for more details, see van Houwelingen, Arends, amp Stijnen, 2002), by SPSS using the macros developed by David Wilson (Lipsey amp Wilson, 2001), by the meta (CRAN Link) and rmeta (CRAN Link) packages in R, and by Comprehensive Meta-Analysis. MetaWin. and the Review Manager of the Cochrane Collaboration. Results either agreed completely or fell within a margin of error expected when using numerical methods. Second, results provided by the metafor package have been compared with published results described in articles and books (the assumption being that those results are in fact correct). On this website, I provide a number of such analysis examples that you can examine yourself. All of these examples (and some more) are also encapsulated in automated tests using the testthat package, so that any changes to the code that would lead to these examples becoming non-reproducible are automatically detected. Third, I have conducted extensive simulation studies for many of the methods implemented in the package to ensure that their statistical properties are as one would expect based on the underlying theory. To give a simple example, under the assumptions of an equal-effects model (i. e. homogeneous true effects, normally distributed effect size estimates, known sampling variances), the empirical rejection rate of H0: theta 0 must be nominal (within the margin of error one would expect when randomly simulating such data). This is in fact the case, providing support that the rma() function is working appropriately for this scenario. Similar tests have been conducted for the more intricate methods in the package. It may also be useful to note that there is now an appreciable user base of the metafor package (the Viechtbauer (2010) article describing the package has been cited in over 1000 articles. many of which are applied meta-analyses and/or methodological/statistical papers that have used the metafor package as part of the research). This increases the chances that any bugs would be detected, reported, and corrected. Finally, I have become very proficient at hitting the Ballmer Peak. For the most part, the development of the package has been funded through my own precious time. Through some collaborative work on the 039Open Meta-Analyst039 software from the Center for Evidence-Based Medicine at Brown University. I have received some funding as part of a subcontract on a grant. Also, Sandra Wilson and Mark Lipsey of the Peabody Research Institute at Vanderbilt University have provided funding for making the rma. mv() more efficient and for adding multicore capabilities to the profile. rma. mv() function. However, further developments of the package could proceed much quicker if additional funding was available. If you are aware of any funding possibilities, feel free to let me know First of all, thanks for trying to do so in the first place. The best way of citing the package is to cite the following paper: Viechtbauer, W. (2010). Conducting meta-analyses in R with the metafor package. Journal of Statistical Software, 36 (3), 148. By the way, try citation(quotmetaforquot) in R (this is not a command specific to the metafor package you can try this with other package names and citation() will tell you how to cite R itself). There are actually quite a number of different R packages available for conducting meta-analyses. Fortunately, there is now a Task View for Meta-Analysis. which provides a pretty thorough overview of the different packages and their capabilities. Technical Questions Standard meta-analytic models (as can be fitted with the rma() function) assume that the sampling variances are known. On the other hand, the models fitted by the lm() and lme() functions assume that the sampling variances are known only up to a proportionality constant. So these are different models than typically used in meta-analyses. For more details, I have written up more comprehensive comparison of the rma() and the lm() and lme() functions. For random-effects models, the I2 statistic is computed with I2 100 times frac 2 2 s2, where hat 2 is the estimated value of tau2 and s2 frac , where wi is the inverse of the sampling variance of the i study (s2 is equation 9 in Higgins amp Thompson, 2002, and can be regarded as the 039typical039 within-study variance of the observed effect sizes or outcomes). The H2 statistic is computed with H2 frac 2 s2 . Analogous equations are used for mixed-effects models. Therefore, depending on the estimator of tau2 used, the values of I2 and H2 will change. For random-effects models, I2 and H2 are often computed in practice with I2 100 times (Q-(k-1))/Q and H2 Q/(k-1), where Q denotes the statistic for the test of heterogeneity and k the number of studies (i. e. observed effects or outcomes) included in the meta-analysis. The equations used in the metafor package to compute these statistics are based on more general definitions and have the advantage that the values of I2 and H2 will be consistent with the estimated value of tau2 (i. e. if hat 2 0, then I2 0 and H2 1 and if hat 2 gt 0, then I2 gt 0 and H2 gt 1). These two sets of equations for I2 and H2 actually coincide when using the DerSimonian-Laird estimator of tau2 (i. e. the commonly used equations are actually special cases of the more general definitions given above). Therefore, if you prefer the more conventional definitions of these statistics, use methodquotDLquot when fitting the random/mixed-effects model with the rma() function. See the analysis example for Raudenbush (2009) for an example of this. The pseudo R2 statistic (Raudenbush, 2009) is computed with R2 frac 2 - hat 2 2, where hat 2 denotes the estimated value of tau2 based on the random-effects model (i. e. the total amount of heterogeneity) and hat 2 denotes the estimated value of tau2 based on the mixed-effects model (i. e. the residual amount of heterogeneity). It can happen that hat 2 lt hat 2, in which case R2 is set to zero. Again, the value of R2 will change depending on the estimator of tau2 used. Also note that this statistic is only computed when the mixed-effects model includes an intercept (so that the random-effects model is clearly nested within the mixed-effects model). You can also use the anova. rma. uni() function to compute R2 for any two models that are known to be nested. The escalc() and rma() functions offer the possibility to transform raw proportions and incidence rates with the Freeman-Tukey transformation (Freeman amp Tukey, 1950). For proportions, this is also sometimes called the 039Freeman-Tukey double arcsine transformation039. For proportions, the transformation ( measurequotPFTquot ) is computed with the equation yi 1/2 times (mbox (sqrt ) mbox (sqrt )), where xi denotes the number of individuals experiencing the event of interest and ni denotes the total number of individuals (i. e. sample size). The variance of yi is then computed with vi 1/(4ni 2). For incidence rates, the transformation ( measurequotIRFTquot ) is computed with the equation yi 1/2 times (sqrt sqrt ), where xi denotes the total number of events that occurred and ti denotes the total person-time at risk. The variance of yi is then computed with vi 1/(4ti). One can also find definitions of these transformations without the multiplicative constant 1/2 (the equations for the variance should then be multiplied by 4). Since the 1/2 is just a constant, it does not matter which definition one uses (as long as one uses the correct equation for the sampling variance). The metafor package uses the definitions given above, so that values obtained from the arcsine square-root (angular) transformation ( measurequotPASquot ) and from the Freeman-Tukey double arcsine transformation ( measurequotPFTquot ) are approximately of the same magnitude (without the 1/2 multiplier, PFT values would be about twice as large). The same applies to square-root transformed incidence rates ( measurequotIRSquot ) and Freeman-Tukey transformed rates ( measurequotIRFTquot ). When used with the default settings, the rma. mh() function in metafor can indeed provide results that differ from those obtained with other meta-analytic software, such as the metan function in Stata, the Review Manager (RevMan) from the Cochrane Collaboration, or Comprehensive Meta-Analysis (CMA). By default, metafor does not apply any adjustments to the cell counts in studies with zero cases in either group when applying the Mantel-Haenszel method, while other software may do this automatically. For more details, take a look at the comparison of the Mantel-Haenszel method in different software and what settings to use to make metafor provide the exact same results as other software. References Freeman, M. F. amp Tukey, J. W. (1950). Transformations related to the angular and the square root. Annals of Mathematical Statistics, 21 (4), 607611. Higgins, J. P. T. amp Thompson, S. G. (2002). Quantifying heterogeneity in a meta-analysis. Statistics in Medicine, 21 (11), 15391558. van Houwelingen, H. C. Arends, L. R. amp Stijnen, T. (2002). Advanced methods in meta-analysis: Multivariate approach and meta-regression. Statistics in Medicine, 21 (4), 589624. Lipsey, M. W. amp Wilson, D. B. (2001). Practical meta-Analysis. Sage, Thousand Oaks, CA. Raudenbush, S. W. (2009). Analyzing effect sizes: Random effects models. In H. Cooper, L. V. Hedges, amp J. C. Valentine (Eds.), The handbook of research synthesis and meta-analysis (2nd ed. pp. 295315). New York: Russell Sage Foundation. Sterne, J. A. C. (Ed.) (2009). Meta-analysis in Stata: An updated collection from the Stata Journal. Stata Press, College Station, TX. faq. txt Last modified: 2016/06/07 19:34 by Wolfgang Viechtbauer


No comments:

Post a Comment