Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Como Mentir com Estatisticas - Darrell Huff, Notas de estudo de Engenharia de Produção

como mentir com

Tipologia: Notas de estudo

2017
Em oferta
30 Pontos
Discount

Oferta por tempo limitado


Compartilhado em 18/10/2017

daniel-carvalho-x5j
daniel-carvalho-x5j 🇧🇷

4.8

(18)

54 documentos

1 / 130

Documentos relacionados


Pré-visualização parcial do texto

Baixe Como Mentir com Estatisticas - Darrell Huff e outras Notas de estudo em PDF para Engenharia de Produção, somente na Docsity! COMO MENTIR COM ESTATISTICAS Darrell Huff EXILADO Livros DADOS DE COPYRIGHT Sobre a obra: A presente obra é disponibilizada pela equipe Le Livros e seus diversos parceiros, com o objetivo de oferecer conteúdo para uso parcial em pesquisas e estudos acadêmicos, bem como o simples teste da qualidade da obra, com o fim exclusivo de compra futura. É expressamente proibida e totalmente repudiável a venda, aluguel, ou quaisquer uso comercial do presente conteúdo Sobre nós: O Le Livros e seus parceiros disponibilizam conteúdo de dominio publico e propriedade intelectual de forma totalmente gratuita, por acreditar que o conhecimento e a educação devem ser acessíveis e livres a toda e qualquer pessoa. Você pode encontrar mais obras em nosso site: LeLivros.site ou em qualquer um dos sites parceiros apresentados neste link. "Quando o mundo estiver unido na busca do conhecimento, e não mais lutando por dinheiro e poder, então nossa sociedade poderá enfim evoluir a um novo nível." PENSAMENTOS Há três espécies de mentiras: Mentiras, Mentiras Descaradas e Estatísticas Disraeli O raciocínio estatístico será um dia tão necessário à cidadania eficaz como a capacidade de ler e escrever. H.G.Wells Não são as coisas que ignoramos que nos atrapalham, mas as que conhecemos. Artemus Ward Números arredondados são sempre falsos. Samuel Johnson Tenho um grande assunto (Estatística) para escrever, mas sinto grandemente minha incapacidade de torná-lo inteligível, sem sacríficar a precisão e a profundidade. Sir Francis Galton INTRODUÇÃO "AQ UI HÁ UM MONTE DE CRIMES" resmungou meu sogro quando se mudou de Iowa para a Califórnia. E havia: No jornal que ele lia. É um jornal que não deixa passar um crimezinho na Califórnia, e que devotaria muito mais espaço a um crime cometido em Iowa do que os maiores jornais de lá. A conclusão de meu sogro era estatística, de maneira informal. Baseava-se numa amostra, uma amostra extraordinariamente tendenciosa. Como muitas outras estatísticas infinitamente mais ambiciosas e sofisticadas, sofria do mal da pré- indicação: considerava que o espaço devotado por um jornal ao crime era uma medida da taxa de criminalidade. Alguns invernos atrás, uma dúzia de investigadores apresentou independentemente números sobre pílulas anti-histaminicas. Cada um demonstrou que uma considerável percentagem de resfriados curava-se após o tratamento. Criou-se uma grande onda, pelo menos nos anúncios, e iniciou-se mais um "lançamento de sucesso" de um produto médico. Baseava-se numa esperança sempre ressuscitável, e também numa curiosa recusa de examinar as estatísticas passadas sobre um fato já bem conhecido, de longa data. Como o humorista Henry G. Felsen (que não tem qualquer pretensão de ser autoridade médica) indicou recentemente, "um resfriado adequadamente tratado dura sete dias, mas deixado a si mesmo, cura-se em uma semana". Assim sucede com muito do que se lê ou se escuta. Médias, relações, tendências, gráficos, tabelas, nem sempre são o que parecem. Pode haver neles mais do que aparenta, mas pode também haver muito menos. A linguagem secreta da Estatística, com tanto apelo à nossa cultura "baseada em fatos", é empregada para sensacionalizar, inflar, confundir e supersimplificar. Métodos e termos estatísticos são necessários para relatar os dados das tendências sociais e econômicas, das condições dos negócios, da "opinião", das pesquisas, dos censos. Mas sem redatores que utilizem as palavras com honestidade e compreensão, e sem leitores que saibam o que significam, o resultado só poderá ser o absurdo semântico. Nos escritos populares sobre assuntos científicos, a maltratada Estatística está quase substituindo a figura do herói de guarda-pó branco, esbaforindo-se sem parar, sem ganhar horas-extras, num sombrio laboratório. A Estatística se parece cada vez mais com o cosmético barato que tenta tornar atraente a amarfanhada cortesã. Uma estatística bem embrulhada, melhor ainda que a "grande mentira" de Hitler,({1}) leva a falsas conclusões, mas ninguém pode acusar o seu utilizador. Este livro é uma espécie de cartilha de como utilizar a estatística para enganar. Pode parecer muito com um Manual para Vigaristas. Talvez eu possa justificá-lo como se fosse um arrombador aposentado, cujas reminiscências publicadas equivalessem a um curso de formação de arrombadores de fechaduras com abafamento do som das marteladas: os criminosos já conhecem estes truques; são os homens de bem que precisam aprendê-los, para sua autodefesa. CAPÍTULO 1 A AMOSTRA COM TENDENCIOSIDADE INTRODUZIDA "O ex-estudante de Yale, formado em 1924, ganha em média 25.111 dólares por ano", afirmou o Time, comentando algo publicado no Sun de Nova Iorque. Ótimo ! Mas... espere aí! Que significa este número impressionante? Será prova - como parece ser - de que, se meu filho for mandado para Yale, eu não mais terei que trabalhar depois de velho, e ele, menos ainda? Duas coisas nesse número saltam aos olhos, se lermos a notícia desconfiados: (1) Sua precisão é surpreendente. (2) É tão bom que não deve ser verdade. É muito improvável que a renda média de qualquer grupo muito espalhado seja conhecida com precisão, até o último dólar. Não é muito provável que você mesmo saiba qual foi sua renda no ano passado, tão precisamente, a menos que seja originária de salário. E rendas de 25 mil dólares dificilmente advirão de salários; as pessoas situadas em tal alíquota muito provavelmente têm investimentos diversificados. Alem disso, esta linda média, sem dúvida, é calculada a partir das quantias que os ex-Yaleistas disseram que receberam. Mesmo que fossem juramentados à verdade, em seu tempo de estudante, lá por 1924, não poderíamos ter certeza de que, depois de tanto tempo, seu horror à mentira tenha sido mantido, pelo menos, no mesmo nível. Algumas pessoas, quando indagadas sobre suas rendas, exageram-nas, por vaidade ou por otimismo. Outros minimizam suas receitas, especialmente (é de lamentar-se) em suas declarações ao Imposto de Renda; e, assim tendo feito, podem hesitar em se contradizer num outro papel. Quem sabe lá onde os olhos dos fiscais podem cair? É possível que ambas as tendências, a da fanfarronada e a da modéstia, cancelem-se mutuamente, mas não é provável. Uma tendência pode ser mais acentuada do que a outra, e não sabemos qual. Comecemos então a examinar um número - que o bom-senso nos diz que dificilmente represente a verdade. Agora, ponhamos o dedo na fonte provável do maior erro, uma fonte que pode apresentar 25 mil dólares como "renda média" de alguns nomes, cuja média real pode bem se aproximar apenas da metade do tal número. Esta fonte é o processo de amostragem, que está no cerne da maior parte das estatísticas que são encontradas sobre todos os tipos de assuntos. Sua base é bem simples, embora seus refinamentos na prática conduzam a muitos atalhos, alguns pouco respeitáveis. Se tivermos um saco de feijão, algum preto e algum fradinho, só há uma maneira de sabermos quantos grãos temos de cada um: Contando-os. Entretanto, podemos achar aproximadamente quantos são pretos, de maneira bem mais fácil, apanhando-se um punhado do saco, e contando só os grãos do punhado, considerando que a proporção seja a mesma no saco inteiro. Se esta amostra for bastante grande, e escolhida adequadamente, representará o todo suficientemente, para a maior parte das finalidades. Caso não seja, a amostra poderá ser menos acurada que uma adivinhação inteligente, e nada terá para recomendá-la, além de um ar espúrio de precisão cientifica. A triste verdade é que as conclusões de tais amostras, tendenciosas, ou muito pequenas, (ou com ambos os defeitos), encontram-se atrás de muitas das informações que lemos, ou que acreditamos conhecer. O relatório sobre o pessoal de Yale origina-se de uma amostra. Podemos estar seguros disso, porque o bom senso nos diz que ninguém pode pegar pelo colarinho todos os sobreviventes daquela classe de 1924. Os endereços de muitos serão forçosamente desconhecidos, depois de mais de quarenta anos. E, entre aqueles cujos endereços são conhecidos, muitos não responderão a um questionário, especialmente um com perguntas de natureza íntima. Com alguns questionários via correio, uma resposta de 5 a 10% é bem alta. Esse questionário poderia ter atingido proporção maior, mas nunca 100%. Tal esperança (de que digam a verdade) não é desprezível. A experiência ganha num tipo especial de estudo de amostragens, a chamada pesquisa de mercado, diz-nos que tal esperança (de respostas verdadeiras) deve ser reduzida quase que a zero. Um levantamento de porta-em-porta, pretendendo pesquisar a leitura de uma revista, foi certa ocasião realizado, tendo entre outras a seguinte pergunta-chave: "Quais as revistas lidas em sua casa?" Quando os resultados foram tabulados e analisados, parecia que muitos leitores preferiam Harper's, uma revista literária, e poucos liam True Story, especializada em xaroposas e melodramáticas novelas. Entretanto, existiam números disponíveis sobre a tiragem editorial dessas revistas, que indicavam claramente que True Story tinha milhões de exemplares em circulação, enquanto que Harper's tinha só algumas centenas de milhares. Assombrados, os planejadores da pesquisa perguntavam se tinham entrado em contato com as pessoas erradas. Mas não! As perguntas foram feitas em todas as espécies de bairros, por todo o país. A única conclusão razoável foi que muitos dos entrevistados não tinham dito a verdade. Tudo o que a pesquisa tinha revelado foi o alto número de pernósticos. Por fim, descobriu-se que, quando se deseja saber o que determinadas pessoas lêem, de nada adianta perguntar-lhes. Pode-se saber muito mais indo às suas casas, pedindo para comprar revistas velhas. Depois disso e só separar as revistas. Mesmo esse recurso furtivo, claro está, não dirá o que o pessoal lê, mas apenas revelará ao quê estiveram expostos. No meio, estarão certamente alguns relatórios técnicos. Da mesma forma, a próxima vez que você ler que o americano médio (ouve-se muita coisa dele ultimamente, a maior parte vagamente improvável) escova os dentes 1,02 vezes por dia - um número que acabei de inventar, mas que é tão bom quanto o de qualquer outra pesquisa - faça uma pergunta a si mesmo: como se pode descobrir isto? Uma mulher, bombardeada por anúncios falados e escritos, que lhe dizem que não escovar os dentes é feio e anti-higiênico, irá confessar ao entrevistador que não escova os dentes regularmente? E se lhe perguntam "Uma vez por dia?", não será tentada a dizer "Duas!" e contribuir para os meus dois centésimos acima? A estatística terá um significado para quem quiser saber o que dizem as pessoas, quando lhes fazem perguntas sobre escovar dos dentes, mas na verdade não adianta muito sobre a freqüência real da aplicação da cerda ao incisivo. Não pode um rio elevar-se acima de sua fonte originaria, dizem. Mas pode parecer que o faz, se houver uma estação elevatória escondida. Assim também é o resultado de uma pesquisa por amostragem: não pode ser melhor do que a amostra em que se baseia. Pelas alturas em que os dados estiverem sendo filtrados, através de camadas e camadas de manipulação estatística, e reduzidos a impressionantes médias decimais, o resultado passa a ter uma aura de convicção que uma espiada mais de perto na amostra original faria desmoronar. A descoberta precoce do câncer salva vidas? Provavelmente. Mas, pelos números geralmente usados para prová-lo, o melhor que podemos dizer é que não salva. Tais números, os arquivos do Registro de Tumores do Connecticut, retrocedem até 1935, e parecem mostrar um aumento substancial na taxa de sobrevivência do período quinquenal, até 1941. Na verdade, tais arquivos iniciaram-se em 1941, e todos os dados anteriores foram obtidos por investigação do passado. Muitos pacientes tinham deixado Connecticut, e não se sabia se viviam ou tinham morrido. De acordo com o relator, o médico Leonard Engel, a tendenciosidade assim introduzida "basta para ser responsável por toda a melhoria indicada na taxa de sobrevivência". Para ter valor, um relatório baseado numa amostragem deve usar uma amostra representativa, que é aquela amostra livre de toda a fonte de tendenciosidade. É aqui que o nosso número para os ex-alunos de Yale mostra sua inutilidade. É aqui também que muitas das coisas lidas em jornais e revistas revelam sua falta de sentido inerente. Um psiquiatra recentemente revelou que praticamente todos são neuróticos. Se assim fosse, tal incidência destruiria o significado da palavra "neurótico" (e todos seriam normais, pois a normalidade pertence à totalidade). Vamos dar uma espiada na amostra do nosso cidadão. Isto é, quem andou o nosso amigo observando? Descobrimos que ele chegou à sua edificante conclusão pelo estudo de seus pacientes, que estão muito, mas muito longe mesmo, de ser uma amostra da população. Se um homem é normal, o nosso psiquiatra terá pouca oportunidade de conhecê-lo. aparecem: sua informação sobre as proporções pode estar incorreta. Você instrui seus entrevistadores para que falem com tantos negros, e com tais e tais percentagens de brancos, em tais e tais alíquotas de renda, com um certo número de advogados etc. e tal. Toda essa gente deve ainda ser dividida entre os acima e os abaixo de quarenta anos. Parece ótimo! Mas... o que acontece? Na questão de branco e preto, o entrevistador acertará com bastante freqüência, se não aparecerem pardos pela frente. Quanto às rendas, os erros serão bem maiores. Quanto a advogados, deve incluir todos os bacharéis? Os que militam no foro? Os que são procuradores, mas passam o tempo a estudar história? Mesmo a questão da idade traz problemas, que o entrevistador hábil (mas profissionalmente errado) contorna escolhendo pessoas obviamente abaixo ou acima dos quarenta. Neste ponto a amostra será tendenciosa pela ausência virtual dos grupos do fim dos trinta e do inicio dos quarenta. É um caso sério! Além de tudo isso, como se obtém uma amostra aleatória dentro da estratificação? O obvio é começar com uma lista de todos e sair atrás de nomes escolhidos ao acaso, mas isso é muito caro. Portanto, você sai à rua - e introduz tendenciosidade por omitir os que estão em casa. Você vai de porta em porta durante o dia - e não encontra a maioria dos que trabalham fora. Você passa a fazer entrevistas noturnas - e não encontra os freqüentadores de cinema, os farristas, os redatores de jornal e os que acompanham as esposas à costureira. A operação de um levantamento resume-se, no final, à batalha contra as fontes de tendenciosidade, e tal batalha é enfrentada ininterruptamente pelas organizações conscienciosas. O que o leitor dos relatórios deve ter em mente é que tal batalha prossegue sempre, e nunca há uma vitória. Nenhuma conclusão do tipo "67% dos americanos são contra" qualquer coisa deve ser lida sem aquela constante dúvida: "67% de quais americanos"? Isto ocorre no Volume Fêmea do Dr. Alfred C. Kinsey (Relatório Kinsey sobre o Comportamento Sexual dos Americanos). O problema, como sucede com qualquer coisa baseada em amostragens, é de como o ler (ou ler um sumário popular do alfarrábio) sem perder de vista que todas as suas afirmações não são obrigatoriamente definitivas, ou mesmo completamente reais. Há pelo menos três níveis de amostragem no caso. As amostras da população (um nível) estão longe de ser aleatórias e podem não ser especialmente representativas, mas são amostras enormes, comparadas com qualquer coisa jamais feita anteriormente no seu campo, e seus números devem ser aceitos como reveladores e importantes, ainda que não inteiramente acurados. Talvez seja mais importante lembrar que qualquer questionário é apenas outra amostra (outro nível) das questões possíveis, e que as respostas dadas pela dama não passa de ainda outra amostra (terceiro nível) de suas atitudes e experiências quanto a cada questão. As espécies de entrevistadores empregados poderão dar um tom especial ao resultado, de modo interessante. Há alguns anos, durante a Segunda Grande Guerra, o National Opinion Research Center enviou dois quadros de entrevistadores para fazer três perguntas a quinhentos negros numa cidade sulista. Um quadro era de brancos, outro de negros. Uma pergunta era: "Os negros serão tratados melhor ou pior, caso os japoneses conquistem os Estados Unidos?" Os entrevistadores negros relataram que nove por cento dos entrevistados respondeu "Melhor". Os entrevistadores brancos receberam apenas dois por cento de tal resposta. E enquanto os negros acharam vinte e cinco por cento de respostas "Pior", os entrevistadores brancos receberam quarenta e cinco por cento. Quando, na pergunta, a palavra "Nazista" foi empregada em lugar de "Japonês", os resultados foram similares. A terceira questão sondava atitudes que poderiam basear-se em sentimentos revelados pelas duas primeiras. "Acredita que seja mais importante concentrar esforços para derrotar o Eixo, ou fazer com que a democracia funcione melhor internamente?" "Derrotar o Eixo" foi a resposta de 39%, de acordo com os entrevistadores negros; 62%, de acordo com os brancos. Aqui encontramos tendenciosidade introduzida por fatores desconhecidos. Parece que o fator mais efetivo foi a tendência, que devemos sempre descontar em qualquer inquérito, de se querer dar uma resposta agradável. Não é, pois, de espantar que, ao responder a uma pergunta com conotações de deslealdade patriótica, em tempo de guerra, um negro sulista dissesse a um homem branco o que soava bem, antes de lhe dizer o que realmente pensava. É também possível que grupos diferentes de entrevistadores escolham diferentes tipos de pessoas para se dirigir. CAPÍTULO 2 A MÉDIA BEM ESCOLHIDA Acredito que você não seja um pernóstico, e eu, certamente, não estou no negócio de imóveis. Mas digamos que você seja, e eu esteja, e que você procure uma propriedade para comprar, numa estrada não distante do vale californiano em que vivo. Tendo avaliado que você é um pernóstico, esforço-me para que saiba que a renda média nessa vizinhança é de 15.000 dólares por ano. Talvez isso faça com que você se decida a viver aqui. De qualquer modo, você compra, e aquele belo número (15.000!) fixa-se em sua mente. É muito provável, sendo você por definição um pernóstico, que o número seja mencionado casualmente em conversa com seus amigos. Um ano depois, nos encontramos. Como membro de uma Comissão de Contribuintes estou passando um abaixo-assinado para que sejam mantidas baixas as avaliações dos imóveis, ou as passagens de ônibus, ou outra coisa qualquer. Meu argumento é que não podemos arcar com o aumento: afinal, a renda média nesta redondeza é de apenas 3.500 dólares por ano. Talvez você venha a aderir: além de pernóstico, você é também um unha-de-fome, mas a pobreza dos 3.500 o surpreende. Eu sou mentiroso agora ou no ano passado? Eu, não!... Aqui está a beleza essencial de mentir-se com estatísticas! Ambos os números são legítimos, legalmente descobertos. Ambos representam os mesmos dados, as mesmas pessoas, as mesmas rendas. De qualquer forma, um ou outro deve ser tão enganador que equivale a uma deslavada mentira. Minha mágica foi usar uma espécie diferente de média de cada vez, já que a palavra média tem um significado muito elástico. Esta mágica é largamente utilizada, às vezes inocentemente, às vezes de propósito, por sujeitos ou indivíduos pretendendo influenciar a opinião pública, ou mesmo para vender espaço para anúncios. Quando alguém lhe disser que "em média" isto e aquilo, você ainda estará sem saber quais das espécies normais de médias se trata, isto é, se é o caso de uma "média", de uma "moda" ou de uma "mediana". O número "15.000" que usei quando precisei de um número grande, é uma média aritmética das rendas de todas as famílias da vizinhança. Obtém-se somando todas as rendas das famílias, e dividindo-se o resultado pelo número de famílias. Quando precisei do número menor, usei a mediana, que nos diz que metade das famílias em questão recebe mais de 3.500 e a outra metade recebe menos de 3.500. Poderia ter ainda usado a moda, que vem a ser, numa série de números, aquele que se encontra com mais freqüência. Aqui, como sucede geralmente com números relativos a rendas, não ser bem explícito é geralmente ser incompreensível ou - pior - mal entendido. Modas, médias e medianas, em certas formas de informação, estão tão juntinhas que ao observador incauto não haverá diferença. Se você lê que a altura dos homens de uma tribo primitiva é em média 1,5 metros, você terá uma idéia bem razoável de sua altura. Não há que indagar se, no caso, trata-se de médias, medianas ou modas; serão aproximadamente a mesma coisa. Claro que se você estiver no negócio de confecção de macacões para exportar para a África, serão necessárias mais informações do que as contidas em quaisquer médias ou medianas. Estas se relacionam aos desvios em relação à média, e serão abordadas em outro capitulo. As diferentes "médias" aparecem juntas quando se lida com dados referentes a muitas características humanas, que graciosamente caem junto ao que se denomina "distribuição normal". Se uma curva for traçada num gráfico para representá-las, você verá que ela se parecerá com um sino - chamam-na elegantemente de "Curva do Sino" - e média, moda e mediana cairão no mesmo ponto. Assim, uma espécie de "média" é tão boa como a outra, para descrever a altura de pessoas, mas isto não servirá para descrever suas carteiras. Se você fizer a lista da renda de todas as famílias numa certa cidade, poderá verificar que oscilam de "um pouquinho" até 50.000 dólares, talvez, e poderão ser achadas umas poucas que sejam bem altas. Mais de 95% estará abaixo de 10.000 dólares. A curva, no gráfico, nada terá da simetria do sino, ficando bem mais semelhante ao perfil de um "escorregador" de parque infantil, com uma "escada" quase vertical, formando um pico, que desce, primeiro abruptamente, numa curva que vai ficando suave até encontrar aos poucos a horizontal. Em tal curva, a média verdadeira estará muito afastada da mediana. Na vizinhança onde lhe vendi o tal imóvel, as duas "médias" estão bem separadas, porque a distribuição é bem assimétrica. Acontece que a maioria de seus vizinhos é de pequenos granjeiros ou empregados num vilarejo vizinho, ou velhotes aposentados. Três dos habitantes, entretanto, são milionários que passam o fim-de-semana aqui, e estes três elevam para as nuvens a renda total, mandando a média aritmética a uma altura extraordinária. A altura é tal que Este exemplo é bem tosco, por ser simplificado, mas é de sublime simplicidade, comparado ao que têm sido perpetrado em nome da contabilidade. Numa empresa complexa, com hierarquias de empregados que se estende da datilógrafa principiante ao diretor-presidente, com gratificações de várias centenas de milhares de dólares, muita coisa poderá ser oculta dessa maneira. Portanto, quando encontrar um número de pagamento médio, pergunte primeiro: "Médio de quê? Quem está incluído?" Certa ocasião, a United States Steel Corporation declarou que a renda semanal média de seus empregados subiu 107% entre 1940 e 1948. É verdade - mas este magnífico aumento fica prejudicado quando se nota que o número de 1940 inclui um número muito maior de empregados em tempo parcial. Se você trabalha em meio-expediente num ano, e expediente integral no outro, sua renda duplicará, mais isto nada modificará a escala do seu salário. Você poderá ter lido nos jornais que a renda da família média americana era de 3.100 dólares anuais em 1949. Não tente descobrir muito sobre tal número, a menos que você também saiba qual "família" foi usada como "média", e que espécie de média é esta. E quem diz isso? E qual a precisão do número? Acontece que este número veio do Bureau do Censo. Se você tiver o relatório do Bureau, não terá dificuldade em descobrir o resto da informação de que precisa, ali mesmo: Trata-se de uma mediana. "Família" significa "duas ou mais pessoas relacionadas uma com a outra e vivendo juntas". Caso fossem incluídas no grupo as pessoas que vivem sozinhas, a mediana cairia para 2.700 dólares, o que é bem diferente. Dando-se ao trabalho de ler as tabelas, você também aprenderá que o número baseia-se numa amostra de tamanho tal que há 19 chances em 20 de que a estimativa - 3.107 dólares, antes de ser arredondada - esteja correta, com margem de erro de 59 dólares para mais ou para menos. Tal probabilidade, e a margem, asseguram uma boa estimativa. O pessoal do Censo tem bastante qualificação e dinheiro para levar seus estudos de amostragem a um grau aceitável de precisão. Presume-se que não tenham que mentir a ninguém. Nem todos os números que você vê, nascem em circunstâncias tão felizes, nem são sempre acompanhados de informações adicionais, que mostrem quão precisos ou imprecisos podem ser. Este ponto abordaremos no próximo capitulo. Enquanto isso, experimente seu ceticismo em alguns itens de uma "Carta do Editor" na revista Time. Quanto aos novos assinantes, diz a carta: "Sua idade mediana é de 34 anos, e sua renda familiar em média é de 7.270 dólares anuais". Ora, uma pesquisa anterior tinha revelado que sua "idade mediana era de 41 anos... renda de 9.535 em média..." A pergunta natural é: Por que, quando é dada a médiana para a idade em ambos os casos, a espécie de média para rendas fica cuidadosamente não-especificada? Será que a média aritmética foi usada por ser maior, parecendo assim balançar com um corpo de leitores mais ricos na ponta do anzol, para fisgar os anunciantes? Experimente você também o jogo "que-espécie-de-média-você-é", na base da alegada prosperidade dos Yaleianos de 1924. Bem, peguemos uma moeda e vamos verificar. Tentei dez vezes e saiu cara oito vezes, o que prova que moedas caem de cara em 80% das jogadas. Bem, pelo menos pelas estatísticas dentifrícias, isto é verdade. Agora, experimente você. Poderá chegar a um resultado de 50-50, mas provavelmente isto não se dará; seu resultado, como o meu, tem uma boa chance de estar bem longe dos 50-50. Mas, se sua paciência durar mil jogadas, você poderá ter (quase) a certeza de obter um resultado muito aproximado de que a metade das jogadas resulte em cara, o que representa a probabilidade real. Apenas quando há um número grande de tentativas é que a lei das médias fornece uma descrição ou predição realmente útil. Quantas vezes bastará? Esta é uma pergunta difícil. Depende, entre outros fatores, do tamanho e da variedade da população que você está estudando por amostragem. E, às vezes, o número na amostra não é o que parece. Um caso interessante surgiu, ligado a um teste da vacina de poliomielite, há alguns anos. Parecia tratar-se de uma experiência de escala impressionantemente larga, ao menos pelos padrões das experiências médicas: 450 crianças foram vacinadas numa comunidade, e 680 ficaram sem vacina, para servir de controle. Pouco depois, a comunidade foi atacada por uma epidemia. Nenhuma das crianças vacinadas contraiu um caso conhecível de pólio. E nenhuma das outras também. O que os experimentadores negligenciaram, ou não perceberam no planejamento de seu projeto, foi a baixa incidência da pólio paralisante. Na taxa normal, apenas dois casos seriam de esperar num grupo de tal tamanho e, assim, o teste foi condenado, de inicio, a não ter sentido. Algo parecido com 15 a 20 vezes essa quantidade de crianças seria necessário para se obter uma resposta significativa de alguma coisa. Muitas das grandes (se bem que temporárias e evanescentes) descobertas médicas, foram lançadas desse modo. "Corra", dizia um médico, "para usar um novo remédio antes que seja tarde". Nem sempre a culpa está com a classe médica. A pressão pública e o jornalismo apressado frequentemente lançam um tratamento não comprovado, especialmente quando a demanda é grande e o panorama estatístico é nebuloso. Isto sucedeu com as vacinas contra resfriados, que foram populares há alguns anos, e mais recentemente com os anti-histamínicos. Um bocado da popularidade dessas "curas" malsucedidas resultou da natureza fugidia do mal, e de um defeito de lógica. Depois de algum tempo, o resfriado é autocurável. Como podemos evitar sermos enganados por resultados inconclusivos? Deve cada um ser seu próprio estatístico e estudar os dados crus por si mesmo? A situação não é assim tão má. Existe um teste de significância que é de fácil compreensão. É simplesmente uma maneira de relatar a estatística de modo que apareça bem claro se um número produzido por testes representa um resultado real, e não algo produzido pelo acaso. Este é o numerozinho que não está lá - na presunção de que você, o leitor leigo, não entenda. Ou que você entenda, quando então é o caso de esconder alguma coisa propositalmente. Caso a fonte de sua informação lhe dê também o nivel de significância, você terá Nada disso deve se refletir negativamente sobre o Dr. Arnold Gesell ou sobre seus métodos. A falha está no processo de filtragem, desde o pesquisador, através do redator sensacionalista ou mal informado, até o leitor, que deixa de notar os numerozinhos que foram sendo abandonados no processo de dar à luz a um número só. Muito da má informação poderia ser evitado se à média fosse adicionada uma indicação da faixa de variação. Os pais, vendo que os filhos se encontram dentro dessa faixa, deixarão de preocupar-se com diferenças pequenas e de pouca importância. É extremamente difícil que um indivíduo seja exatamente normal em qualquer ponto, exatamente como uma moeda que, jogada 100 vezes, rarissimamente cairá exatamente 50 vezes de um jeito e 50 de outro. Confundir "normal" com "desejável" piora por demais a situação. O Dr. Gesell simplesmente revelou certos fatos observados. Foram os pais que, ao ler os livros e artigos, concluíram que uma criança que começa a andar um dia, ou em um mês, após a média, deve estar em inferioridade. Muito da critica estúpida ao relatório do Dr. Alfred Kinsey, muito conhecido (ainda que muito pouco lido), resultou que "normal" fosse considerado equivalente a "bom", "correto" ou "desejável". O Dr. Kinsey foi acusado de corromper a juventude, dando-lhe "idéias", e especialmente por denominar "normal" tudo quanto é tipo de prática sexual popular, mas reprovada. Entretanto, ele simplesmente afirmou que tinha descoberto serem tais atividades "usuais", que é exatamente o que significa "normal", não as tendo carimbado com qualquer selo de aprovação. ("Normal", em estatística, significa apenas "Usual", e nunca "Correto", "Desejável" ou "Bom"). O Dr. Kinsey achou que estaria fora do escopo de seu trabalho, classificá-las de travessuras ou não. Por isso esbarrou em algo que muito tem incomodado inúmeros outros observadores: É perigoso mencionar qualquer assunto com alto conteúdo emocional sem antes se declarar, bem rapidamente, onde é que se está contra ou a favor. O que é enganoso, quanto ao numerozinho que não está lá, é que sua ausência geralmente passa despercebida. Aqui, claro, está o segredo de seu sucesso. Os críticos do jornalismo, como praticado atualmente, deploram a economia atual da sola dos sapatos dos repórteres e redatores. Para uma amostra do jornalismo pouco empreendedor, vejam este item de uma lista de "novos progressos industriais", na revista noticiosa Fortnight: "Um novo banho de têmpera fria que triplica a dureza do aço da Westinghouse". Divirto-me ao notar que, aplicando à tabela a altura que tenho anotada quando entrei para o secundário aos quatorze anos, não deveria ter excedido 1,75 m. Tendo 1,83 m posso dizer que 8 cm de erro na pequena faixa da altura humana é uma fraca adivinhação. Diante de mim encontram-se os invólucros de duas caixas de flocos de cereais para o café da manhã. São edições ligeiramente diferentes, como indicam as fontes de referência: Uma fala de Pete Dois-Tiros, e a outra diz: "Se quiser ser como Hoppy, tem de comer como Hoppy!" Ambas mostram, além dos respectivos "cow-boys" Hoppy e Pete, gráficos para demonstrar ("Cientistas provaram que é verdade") que estes flocos "começam a dar energia em dois minutos!" Num caso, o gráfico escondido nesta floresta de pontos de exclamação leva números num lado; no outro os números foram omitidos. Isto não faz diferença, pois não se sabe mesmo o que tais números significam. Ambos mostram uma linha vermelha bem íngreme ("liberação de energia"), porém numa tabela a linha inicia-se um minuto depois de ingeridos os flocos, e na outra, dois minutos após. Além disso, uma das linhas sobe numa razão dupla da razão da outra, sugerindo que o próprio desenhista não considerou que tais gráficos valessem coisa alguma. Tais asneiras só podem ser encontradas em material destinado aos olhos de uma criança, ou de seu matinalmente semidesperto pai, claro. Ninguém insultaria a inteligência de um grande homem de negócios com tais impropérios estatísticos. Mas... Será mesmo?... Deixem-me falar de um gráfico usado para fazer propaganda de uma agência de publicidade (espero não estar confundindo muito você). Apareceu nas colunas muitíssimo especiais de Fortune. A linha, neste gráfico, mostrava a impressionante tendência ascensional dos negócios da agência, ano por ano. Não havia números. Com a mesma honestidade (?) tal gráfico poderia representar um enorme crescimento, com os negócios dobrando ou aumentando em milhões de dólares por ano, ou poderia mostrar o progresso tartaruguesco de uma empresa estática, que adicionasse apenas um dólar ou dois ao seu faturamento anual. Mas o quadrinho é impressionante, de qualquer modo. Dê pouca fé a uma média, a um gráfico ou a uma tendência, quando números importantes como esses não aparecem. Por outro lado, você estará tão cego quanto um homem escolhendo um local de piquenique, guiado apenas por uma lista de temperaturas médias. Você poderá considerar 17ºC como uma média anual confortável na Califórnia, e indo à Califórnia poderá dar com os costados em áreas oscilando entre o deserto interior e a ilha de San Nicolas, na costa sul. E com isso você poderá ficar frito ou congelado, se ignorar a faixa que produziu a média californiana, pois San Nicolas tem uma mediazinha particular de 20ºC, mas oscila de 8 a 31ºC, e no deserto, onde a media é quase a da Califórnia (17ºC) a temperatura vai de -8 a 41ºC. Oklahoma City teve suas temperaturas médias bem constantes, nos últimos 60 anos: 16,3ºC. Mas como você poderá constatar no gráfico abaixo, nesta temperatura aprazível se esconde uma faixa de variação de 51ºC. CAPITULO 4 MUITO BARULHO POR PRATICAMENTE NADA Caso não se incomode, começaremos por lhe dar duas crianças: Pedro e Paula, que foram submetidas a testes de inteligência, como sucede com muitas crianças no decorrer de sua educação. Ora, o teste mental, de qualquer variedade, é um dos grandes fetiches de nossa era, de modo que você tera que discutir um pouco para chegar a descobrir os resultados dos testes; tal informação é tão esotérica, tão resguardada dos olhos profanos, que geralmente só é considerada segura nas mãos de psicólogos e autoridades educacionais, e pode ser que andem muito certos! De qualquer modo, suponhamos que você descubra que o QI (Quociente de Inteligência) de Pedro é 98 e o de Paula é 101. Suponhamos ainda que você saiba que o QI se baseia no número 100 como sendo a média, ou o "normal". Ah! Paula é a mais brilhante dos dois! Além disso, está acima da média. Pedro está abaixo, mas deixemos isto, por ora. Conclusões como estas são pura idiotice. Só para aclarar o ambiente, vamos notar primeiro que, seja o que for que qualquer teste de inteligência venha a medir, tal coisa não será bem aquilo que usualmente consideramos inteligência. São deixados de fora pontos importantes como liderança e imaginação criativa. Não se leva em conta o julgamento social ou aptidões musicais ou artísticas, para não dizer de coisas da personalidade, como diligência e equilíbrio emocional. Por cima de tudo, os testes geralmente aplicados nas escolas são do tipo rápido-e-barato, que dependem um bocado da facilidade de leitura; brilhante ou não, o leitor de apreensão lenta não tem grandes chances de se sair bem neles. Digamos que reconheçamos tudo isso, e concordemos em considerar o QI simplesmente como uma medida de uma capacidade vagamente definida de lidar com abstrações enlatadas. E Pedro e Paula receberam o que se poderá considerar um dos melhores testes, o Stanford-Binet Revisto, que é administrado individualmente e não exige nenhuma capacidade excepcional de leitura. Ora, o que um teste de QI pretende ser é meramente uma amostragem do intelecto. Como outro produto qualquer do método de amostragem, o QI é um número, com um erro estatístico que expressa a precisão ou fidedignidade de tal número. Fazer as perguntas do teste parece um tanto com o que você poderia fazer para estimar a qualidade do milho num campo, andando por ele, e arrancando uma espiga aqui e outra lá, ao acaso. No momento em que tiver arrancado e examinado umas cem espigas, voce terá uma idéia razoável de todo o milharal. Sua informação será bastante exata para uso na comparação deste milharal com outro - caso ambos não sejam muíto parecidos. Se forem parecidos, você terá que examinar um número muito maior de espigas, e avaliá-las por um padrão de qualidade mais preciso que seus olhos. A justeza com que sua amostra possa ser considerada como representativa de todo o milharal é uma medida que pode ser representada por números: o erro- provável e o erro-padrão. Suponhamos que você tenha que medir o tamanho de muitos campos, andando ao longo das cercas. A primeira coisa que deve ser feita é verificar a justeza de seu sistema de medida, andando várias vezes uma distância medida de cem metros, para verificar quantos passos seus estão ali contidos. Você poderá déscobrir que, em média, haverá um erro de três metros. Isto é, você deixou de acertar a linha exata de cem metros por menos três metros, em metade de suas tentativas, e por mais três metros na outra metade. Seu erro provável será então de três metros em cem, ou três por cento. Daqui por diante, cada cerca que for medida por seus passos, de cem em cem metros, deverá ter tal medição expressa como (100 metros mais ou menos 3 metros). A maioria dos estatísticos prefere agora usar outro método de medição, diferente mas comparável, chamado "método do desvio-padrão". Tal método considera cerca de dois terços dos casos, em lugar de exatamente a metade, e é considerado mais jeitoso, do ponto de vista matemático. Para nossa finalidade, poderemos ficar no método do erro provável, que é o utilizado nos testes Stanford-Binet. Como sucede nos nossos passos hipotéticos, descobriu-se que o erro provável do QI Stanford-Binet e de três por cento. Isto nada tem a ver com a qualidade básica do teste, mas apenas relaciona-se com o grau de justeza ou acuracidade com que ele "sempre" mede o que quer que seja medido. Assim, o QI indicado para Pedro poderá ser mais completamente expresso como 98 (+ ou -) 3 e o de Paula como 101 (+ ou -) 3. Isto revela que há uma chance 'igual' para que o QI de Pedro 'caia' entre 95 e 101; ou que esteja acima ou abaixo de tais números. Do mesmo modo, Paula não tem uma chance melhor do que 50-50 de ficar na faixa de 98 a 104. Dai você depreenderá rapidamente que há uma chance em quatro de que o QI de Pedro CAPÍTULO 5 OS GRÁFICOS MALUCOS Há terror nos números. Humpty -Dumpty dizia a Alice que as palavras que usava significavam o que ele queria que significassem, nem mais nem menos. Mas poucas pessoas há que tenham a coragem de estender esta elasticidade aos números. Talvez soframos de um "trauma de respeito" induzido pela aritmética aprendida na escolinha pública. Seja qual for a causa, ela cria um problema para o escritor que deseja ser lido, para o publicitário que espera que seu texto venda mercadoria, para o editor que deseja que seus livros ou revistas sejam populares. Quando os números dispostos tabularmente forem tabu, e as palavras não trabalharem bem, como geralmente sucede, só há uma resposta: 'desenhe uma figurinha.' A figurinha estatística (ou gráfico) mais simples é a da variedade linear. É muito útil para demonstrar tendências, algo que praticamente todos têm interesse em mostrar, ou conhecer, ou descobrir, ou deplorar, ou adivinhar. Vamos deixar nosso gráfico mostrar como a renda nacional aumentou dez por cento em um ano. Comece pegando papel quadriculado. Ponha os meses embaixo. Indique bilhões de dólares ao lado. Marque seus pontos e junte-os com uma linha, e seu gráfico ficará parecido com isto: Agora está impressionante, não? Qualquer um que olhe para esta tabela poderá sentir a prosperidade latejando nas artérias vitais da nação! É um equivalente mais sutil do texto: "Renda nacional sobe dez por cento", transformado em "Dispara vertiginosamente, atingindo a culminância de dez por cento!" É vastamente mais eficiente, não contém adjetivos, advérbios ou palavras que prejudiquem a ilusão de sóbria objetividade. Nada há que possam acusar você. E você estará em boa (ou, pelo menos, respeitável, companhia). O 'Newsweek' usou este método para mostrar que "Ações atingem um ápice de 21 anos", em 1951, truncando o gráfico na linha dos 80. Um anúncio da Columbia Gas System no Time em 1952 reproduziu um gráfico "de nosso relatório anual". Lendo-se e analizando-se os numerozinhos, descobre-se que num periodo de dez anos o custo de vida subiu cerca de 60% e o preço do gás somente 40%. Este é um quadro favorável, mas ao que parece não era ainda bastante favorável, na opinião da companhia. Cortaram seu gráfico nos noventa por cento (sem rasgos ou interrupções para avisar os incautos) de modo que seu olho lhe dirá: O custo de vida mais que triplicou; o preço do gás desceu de um terço! Companhias de aço também têm usado esses recursos enganosos para tentar engambelar a opinião pública contra aumentos salariais. Entretanto, o processo está longe de ser novo, e sua falsidade foi demonstrada há muito tempo - e não somente em publicações técnicas para uso de estatisticos. Um redator editorial na Dun's Review de 1938 reproduziu um gráfico de uma notícia, advogando anúncios em Washington, D.C., o argumento sendo muito bem expresso no título acima do gráfico: "Despesas com funcionarismo sobem!" A linha no gráfico combinava bem com o ponto de exclamação, ainda que os números escondidos atrás da linha não o fizessem. O que mostravam era um aumento de cerca de 19,5 milhões para 20,2 milhões. Mas a tal linha vermelha saltava de junto da base do gráfico até bem no seu topo, fazendo com que um aumento inferior a quatro por cento parecesse mais de 400. A Dun's Review dava sua própria versão gráfica dos mesmos números ao lado - uma linha vermelha honesta, que só subia realmente quatro por cento, sob este titulo: "DESPESAS COM FUNCIONALISMO ESTABILIZADAS." A Collier's usou este mesmo tratamento com um gráfico de barras, em anúncios pelos jornais. Note especialmente que o meio do gráfico foi cortado fora: 3,205,000 3,200,000; 3,150,000] 3104729 Mpiado gráfico 3.100,00] ra ora imeiros Três últimos — Primeiros 9 meses meses — trósmeses de 1952 de 1952 de 1953 Do anúncio da COLLIER'S de 24-4-53 apressado. É assim que um gráfico pictórico honrado é feito. Isto me satisfaria, caso tudo o que eu desejasse transmitir fosse informação. Mas eu quero mais! Eu quero dizer que o trabalhador americano está muito melhor que o rotundiano, e quanto mais puder dramatizar a diferença entre trinta e sessenta, melhor. Para dizer a verdade (o que, claro está, é o que pretendo 'não' fazer) quero que você conclua por si mesmo qualquer coisa, que tenha uma impressão exagerada, mas não quero ser pego com a boca na botija das minhas malandragens. Há um meio, e é um meio que está sendo empregado diariamente para enganar os incautos. Simplesmente desenho um saco de dinheiro para representar os trinta dólares do rotundiano, e depois desenho outro, com o dobro da altura, para representar os sessenta do americano. Está proporcional, não? Agora eu tenho a impressão que procurava! O salário do americano torna-se gigantesco ao lado do outro. É óbvio que como o segundo saco tem o dobro da altura, terá também o dobro da largura; portanto não ocupa o dobro, mas sim o 'quádruplo' da área. Os numeros ainda dizem um para dois, mas a impressão visual, que é a dominante, diz que a razão é de um para quatro, Ou pior! Como são representações de objetos de três dimensões, o segundo saco ainda parece ter o dobro da grossura do primeiro. Como dirá o seu livro de geometria, os volumes de sólidos semelhantes variam na proporçao do cubo de qualquer dimensão similar. Duas vezes duas vezes dois são oito! Se o saquinho contém $30, o outro dá a impressão de conter, não $80, mas $240. Olhe outra vez para eles. E esta é, na verdade, a impressão que meu engenhoso gráfico dá. Ainda que dissesse "o dobro", deixei a impressão perdurante de uma razão de oito-para-um. Será dificil que você possa acusar-me de qualquer intenção criminosa. Estou fazendo apenas o que muita gente boa faz. O Newsweek faz isso, e também com saquinhos de moedas. 0 American Iron and Steel Institute já o fez com um par de altos fornos. A idéia era mostrar como a capacidade siderurgica da indústria progrediu de 1930 a 1940, para provar que tal indústria era capaz, e que não necessitava de interferências governamentais. Há mais mérito no principio do que na maneira de apresentá-lo. O alto forno, representando a capacidade de dez milhões de toneladas, adicionada à industria na década dos 30, foi desenhado pouco além de dois terços da altura do alto forno de 14 1/4 milhões, representativo do incremento na década de 40. O olho vê dois fornos, um quase três vezes maior que o outro. Dizer "quase um-e-meio" e ser entendido como "três"... eis a façanha que o quadrinbo-de-uma-só-dimensão é capaz. Esta obra de arte do pessoal siderúrgico tem outros pontos interessantes. O segundo forno, de certo modo, engordou horizontalmente fora de proporção com seu vizinho, e uma barra negra, sugestiva de ferro derretido, ou coisa que o valha, tornou-se duas-e-meia vezes mais comprida do que na década antecedente. Aqui dá-se um aumento de 50 por cento, que passa a ser desenhado como 150 por cento, para dar uma impressão visual de mais de mil e quinhentos por cento. A aritmética torna-se fantasia mágica! Seria pouco caridoso mencionar que a mesma página de papel cuchê em quatro cores oferece um espécime, de bom a ótimo, de gráfico de linha truncado. Uma curva exagera o crescimento per-capita da capacidade siderúrgica, pelo corte da metade inferior de seu gráfico. Isto, como vimos, é poupança de papel, e dobra também a taxa do progresso. Muitos desses casos podem não passar de desenhos malfeitos. Mas a coisa é como receber troco errado: Quando todos os erros são a favor do caixa, não se pode deixar de ficar pensando... A Newsweek uma vez mostrou como "os velhos americanos ficam mais velhos", por meio de um gráfico em que apareciam dois homens, um representando a CAPÍTULO 7 O NÚMERO PRÉ-INIDICADO Se você não puder provar o que deseja, demonstre outra coisa e finja que são iguais. Na confusão que resulta do choque da estatística com a mente humana, dificilmente alguém notará a diferença. O número pré-indicado é uma arma garantida para manter você em boa situação. Funciona sempre. Você não pode provar que seu remédio cura resfriados mas pode publicar (em letras grandes) um atestado de um laboratório, "sob a autoridade" de algum médico, de que meia onça do preparado matou 31.108 germes num tubo de ensaio, em onze segundos. Nessa ocasião, assegure-se de que o laboratório tenha boa reputação ou nome famoso. Reproduza o relatório completo. Fotografe um médico em roupas brancas e coloque o retrato ao lado do relatório. Mas não mencione os truques da sua história. Não cabe a você - claro - mostrar que um antisséptico que atua bem num tubo de ensaio pode não atuar na garganta humana, principalmente depois de diluído, de acordo com as instruções, para evitar queimar os tecidos da goela. Não confunda o resultado dizendo qual o tipo germe que foi morto. Quem conhece o germe causador do resfriado? E, até, provavelmente, não seja nenhum germe. Na verdade, não há ligação conhecida entre a multidão de germes de um tubo de ensaio e o seja-lá-o-que-for que causa resfriados, mas as pessoas não vão discutir isso com precisão, principalmente enquanto estão fungando. Talvez isso seja bastante óbvio, e o povo começa a notar, embora os anúncios não dêem a perceber. De qualquer modo aqui está uma versão mais ardilosa: Digamos que durante um período de aumento do preconceito racial você seja contratado para provar o contrário. Não é uma tarefa árdua. Faça uma enquete ou, melhor ainda, mande uma organização de bom conceito fazê-la. Pergunte àquela parcela usual da população se eles acham que os negros têm chance tão boa quanto os brancos de conseguir emprego. Repita seu levantamento em intervalos, de modo a ter uma tendência geral para relatar. O Escritório de Pesquisas de Opinião Pública de Princeton, certa vez, testou essa pergunta. O que veio à tona foi uma interessante evidência de que as coisas, especialmente nas pesquisas de opinião, não são sempre o que aparentam. A cada pessoa perguntada sobre empregos, foram também feitas perguntas com o fim de descobrir se tinha forte preconceito contra os negros. Revelou-se que as pessoas que tinham forte preconceito racial eram mais inclinadas a responder "Sim" para a pergunta sobre oportunidades de emprego. (Ocorreu que dois terços dos que eram simpáticos aos negros não achavam que os negros tinham tão boa chance quanto os brancos num emprego, e cerca de dois terços dos que demonstravam preconceito diziam que os negros estavam conseguindo tão boa chance quanto os brancos), Era bem evidente que dessa votação você aprenderia muito pouco sobre as condições de emprego para os negros, ainda que pudesse aprender algumas coisas interessantes sobre as atitudes raciais do homem. Você pode ver, então, que, se o preconceito avoluma-se durante o periodo de sua pesquisa, haverá um número crescente de respostas para o fato de os negros terem chances de emprego tão boas quanto os brancos. Assim você anuncia os resultados: Sua pesquisa mostra que os negros estão recebendo cada vez mais um pouco para a comparação, a menos que venha acompanhado do total de passageiros por km. Se estiver preocupado com a probabilidade de ser morto numa longa viagem, não conseguirá informação muito valiosa, perguntando o quê matou mais no ano passado, se foram os trens, ou aviões ou carros. Atinja seu propósito procurando saber o número de casos fatais para cada milhão de passageiros por km. Isso aproximar-se-á do risco que se corre. Há muitas outras formas de coletar dados sobre alguma coisa, e depois relatá-los como se fosse outra. O método geral é apanhar duas coisas que se parecem, mas não são iguais. Como gerente do departamento de pessoal de uma companhia que está em briga com o sindicato, você "faz uma pesquisa" para ver quantos têm queixas contra o sindicato. A menos que o sindicato fosse composto de anjos chefiados por um arcanjo, você pode perguntar e anotar com perfeita honestidade e conseguir uma prova de que a maioria dos homens tem queixas. Você apresenta seu relatório de que "uma vasta maioria - 78 por cento - é contra o sindicato". O que você fez foi juntar um bando de queixas não diferenciadas, e pequenas reclamações, e depois chamá-los de outra coisa que parece a mesma. Você não provou nada, mas bem parece que sim, não é mesmo? É honesto, ainda que só de certo modo. O sindicato poderia também vir a "provar" que praticamente todos os trabalhadores queixavam-se de sua empresa. Se você deseja continuar procurando números pré-determinados, deve tentar os balanços de sociedades anônimas. Procure os lucros que poderiam parecer muito grandes, e são escondidos com outro nome. A revista Ammunition (Munição) do Sindicato dos Trabalhadores na Indústriá de Automóveis descreve o mecanismo desse modo: O artigo diz que no ano passado a Companhia obteve 35 milhões de lucro. Exatamente um e meio por cento das vendas. Você sente até pena da Companhia. Se uma lâmpada se queima no banheiro, a Companhia gasta 30 centavos para substitui-la. É igual ao lucro correspondente a 20 dolares de faturamento. Isso faz até o empregado poupar papel higiênico, de pena. Mas a verdade é que a Companhia declara como lucro somente metade ou um terço do lucro. A parte que não é declarada está escondida nas depreciações e reservas. Brincadeira igual consegue-se com as percentagens. Num período recente, a General Motors foi capaz de declarar um lucro modesto (deduzindo impostos) de 12,6 por cento das vendas. Mas, para o mesmo período, os lucros nos seus investimentos atingiram 44,8 por cento, o que parece bom negócio, ou mau, dependendo do tipo de discussão que você pretende vencer. Similarmente, a coluna dos leitores da revista Harper's veio em defesa das lojas A&P, apontando o baixo lucro liquido de somente 1,1 por cento das vendas. Perguntava-se: "Algum cidadão condenaria como 'tubarão' quem ganhasse pouco mais de 10 dólares em cada 1.000 dólares investidos por ano?" À primeira vista, esse 1,1 por cento parece quase calamitosamente pequeno. Compare com os 4 a 6 por cento de juro que é o usual nos Bancos. Não seria melhor se a organização A&P fechasse suas lojas e colocasse todo seu capital no Banco e vivesse dos juros? A verdade é que o valor do retomo anual do investimento não é igual ao valor expresso pelo ganho no total sobre as vendas. Como outro leitor respondeu: "Se eu comprar cada manhã um artigo por 99 centavos e vendê-lo à noite por 1 dolar, estarei ganhando 1 por cento do total das vendas, mas 365 por cento do dinheiro investido no ano". Há frequentemente muitas formas de expressar qualquer número. Você pode, por exemplo, exprimir o mesmo fato, chamando-o de retorno de 1 por cento das vendas, 15 por cento de retorno do investimento, lucro de 10 milhões, aumento de 40 por cento nos lucros (comparado com a média de 1935-39), ou decréscimo de 6 por cento do ano passado. O método é escolher aquele que soa melhor para o objetivo desejado, e confiar em que poucos dos leitores vão reconhecer a imperfeição com que o núumero reflete a situação. Nem todos os números predeterminados são fruto de fraude intencional. Muitas estatísticas, inclusive as médicas, que são importantes para todos, são distorcídas por incoerências na origem. Há dados impressionantemente contraditórios em assuntos delicados como abortos, filhos naturais e sífilis. Se você olhasse os mais recentes dados sobre gripes e pneumonia, chegaria à estranha conclusão que estas doenças estão praticamente confinadas aos três estados sulinos, que têm cerca de oitenta por cento dos casos constatados. Na verdade o que explica essa percentagem é que esses três estados continuavam a exigir dos médicos que informassem tais casos, quando os demais estados praticamente haviam abandonado tal exigência. Alguns dados sobre a malária pouco significam. Na América do Sul, em locais onde antes de 1940 havia centenas de milhares de casos por ano, há agora somente uns poucos. Aparentemente houve uma importante mudança na salubridade desses locais, em poucos anos. Mas tudo o que ocorreu foi que os casos somente são registrados quando são comprovadamente de malária, enquanto que antes a palavra era muito usada coloquialmente para designar qualquer gripe ou febre. A taxa de mortalidade na Marinha, durante a guerra Hispano-Americana, foi de nove por mil. Para os civis na cidade de Nova York, no mesmo período, foi de dezesseis para mil. O recrutamento naval usou esses números, mais tarde, para mostrar que era mais seguro estar na Marinha do que fora dela. Admita que tais números estejam corretos, o que provavelmente é verdade. Pare por um momento e veja se descobre o que os torna sem o sentido que os recrutadores quiseram dar. Os grupos não são comparáveis. A Marinha é composta principalmente de jovens com comprovada condição de saúde. A população civil inclui criancinhas, velhos, doentes, todos aqueles que têm alta taxa de mortalidade, qualquer que seja o lugar onde estiverem. Esses números não provam absolutamente que os homens, nos padrões da Marinha, viverão mais tempo dentro do que fora dela. E também não provam o contrário. Você deve ter ouvido a notícia desencorajadora de que 1952 foi o pior ano de poliomielite na história da medicina. Essa conclusão foi baseada no que poderia parecer a evidência total desejada; houve muito mais casos notificados naquele ano do que antes. Mas, quando os peritos revolveram analisar aqueles números, acharam coisas mais encorajadoras. Uma foi que havia em 1952 tantas crianças na idade mais suscetível, que o número de casos tenderia a atingir um recorde, ainda que a proporção de casos permanecesse no mesmo nivel. Outro era que uma conscientização geral sobre a pólio estava levando a um diagnóstico mais frequente a constatação também dos casos benígnos. Finalmente, havia um incentivo financeiro maior, havendo mais seguros contra pólio e mais ajuda disponivel da Fundação Nacional contra Paralisia Infantil. Tudo isso lançou uma dúvida considerável sobre a noção de que a pólio havia atingido um novo recorde. e o baixo número total de mortes confirmou a dúvida. É uma fato interessante que a percentagem de mortes ou o número de mortes é frequentemente uma medida melhor da incidência de uma doença do que os dados numéricos diretos da incidência - simplesmente porque é muito melhor a qualidade da informação e registro nos casos fatais. Na América, o número predeterminado atinge um grande florescimento cada quatriênio. Isso não significa que haja uma natureza cíclica nos tais números, mas apenas a chegada das campanhas eleitorais. Uma campanha levada a efeito pelo Partido Republicano em outubro de 1948 foi inteiramente feita com números que pareciam ter ligação, mas não tinham: CAPÍTULO 8 POST HOC VOLTA À CENA Uma vez alguém teve um bocado de trabalho para descobrir se os fumantes tiram menores notas no colégio do que os não fumantes. Descobriu-se que sim. Isso ágradou a muitas pessoas e elas têm feito muito uso disso, desde então. O caminho para boas notas, parecia, estava em deixar de fumar; e para levar a conclusão a um razoável passo à frente: fumar turva a mente. Esse estudo, em particular, foi, creio eu, bem feito: uma amostra suficientemente grande, honesta e cuidadosamente escolhida, correlação com alta significância etc. A falácia é antiga. Todavia, tem uma poderosa tendência a surgir em assuntos estatísticos, onde está disfarçada por uma guarnição de números impressionantes. É aquela que diz que "se B segue-se a A, então A foi a causa de B ." Uma suposição sem fundamento foi feita: desde que fumo e notas baixas caminham juntos, o fumo causa notas baixas. Não poderia bem ser o contrário? Talvez notas baixas levem o estudante não à bebida mas ao tabaco. Neste ponto, esta conclusão é mais ou menos semelhante à outra, e do mesmo modo bem apoiada pela evidência. Mas não é tão satisfatória aos propagandistas. Parece bem mais provável, todavia, que nenhum desses fatos tenha produzido o outro, mas ambos sejam produto de algum terceiro fator. Será que o tipo social que considera seus livros com menos seriedade é também o mais tendente ao fumo? Ou há uma pista no fato de que alguém uma vez já estabeleceu uma correlação entre extroversão e notas baixas - uma relação aparentemente mais próxima do que aquela entre notas e inteligência? Talvez os extrovertidos fumem mais que os introvertidos. O ponto é que, quando há muitas explicações razoáveis, você dificilmente tem o direito de escolher aquela que serve ao seu intuito, e insistir nela. Mas muitos fazem exatamente isso. Para evitar cair no engano do Post Hoc ("Depois disso", em Latim) e dai acreditar em muitas coisas que não são verdadeiras, você precisa inspecionar minuciosamente qualquer afirmativa de relação entre as coisas. A correlação, aquele número convincentemente preciso, que parece provar que uma coisa ocorre em virtude de outra coisa, pode na verdade ser de vários tipos. Uma é a correlação devida ao acaso, Você pode juntar um grupo de números e com eles provar alguma coisa inesperada, mas se tentar de novo, seu próximo grupo de números pode absolutamente não provar a tal coisa. Como a pasta de dentes que parecia reduzir a cárie, você simplesmente elimina os resultados que não quer, e publica amplamente aqueles que deseja. Com uma amostra pequena, é provável achar-se alguma correlação substancial entre qualquer par de características ou eventos que você imagine. Uma espécie comum de correlação é aquela na qual a relação é real, mas nao é possível se estar seguro de qual das variáveis seja a causa e qual o efeito. Em alguns desses casos, causa e efeito podem se alternar de hora em hora, ou ambos podem, sem dúvida, ser causa e efeito ao mesmo tempo. Uma correlação entre a renda e a propriedade de ações deve ser dessa espécie. Quanto mais dinheiro você ganha, mais ações compra, e quanto mais ações compra mais dinheiro ganha; não é correto dizer simplesmente que uma produziu a outra. Talvez a mais ardilosa delas seja o exemplo, muito comum, no qual nenhuma das variáveis tenha qualquer efeito sobre a outra, e ainda assim haja uma correlação real. Uma grande quantidade de tapeação tem sido feita com esse tipo. As notas baixas entre os fumantes está nessa categoria, como está a maioria das estatísticas médicas citadas, sem a qualificação de que, apesar da relação mostrar-se real, a natureza de causa-e-efeito é somente uma questão de especulação. Como exemplo do absurdo, ou de correlação falsificada, alguém alegremente apontou um fato estatistico real: Há uma relação próxima entre o salário dos pastores presbiterianos em Massachusetts e o preço do rum em Havana. Qual é a causa e qual o efeito? Em outras palavras, estão os pastores se beneficiando do comércio do rum ou subvencionando-o? Bem, isto é tão forçado que torna-se ridículo à primeira vista. Mas observe outras aplicações da lógica do Post Hoc, que diferem somente por serem mais sutis. No caso dos pastores e do rum é facil se ver que ambos os números estão crescendo em virtude da influência de um terceiro fator: o histórico aumento mundial no nível de preços de praticamente tudo. Apanhe os números que mostram que a taxa de suicídios atinge o máximo em junho. Os suicídios produzem noivados em junho ou os casamentos de junho precipitam o suicídio dos desprezados? Uma explicação mais convincente (ainda que igualmente não provada) é que o indivíduo que recalca suas depressões por todo o inverno, com a idéia de que as coisas serão mais róseas na primavera, desiste quando chega junho e ainda se sente deprimido. A passagem seguinte foi tomada de um artigo, em forma de pergunta-e-resposta, da revista This Week, suplemento dominical de enorme circulação. Talvez você ache divertido, como eu achei, que o mesmo escritor tenha feito um artigo denominado "Crenças Populares: Falsas ou Verdadeiras?" P: Qual o efeito da frequência à faculdade na sua chance de permanecer solteiro? R: Se for mulher, aumenta enormemente sua probabilidade de tornar-se uma velha solteirona. Mas se você for homem, tem o efeito oposto - diminui sua chance de permanecer solteiro. A Universidade de Cornell fez um estudo com 1.500 formandos típicos de meia idade. Dos homens, 93 por cento eram casados (comparado com 83 por cento da população geral). Mas entre as formandas, de meia idade, somente 65 por cento eram casadas. As solteironas eram três vezes mais numerosas entre as mulheres formadas do que entre as da população em geral. Quando Susie Brown (dezessete anos de idade) lesse isso, saberia que, se fosse para a faculdade, teria menos chance de conseguir um marido do que se não fosse. Isso é o que afirma o artigo, e há estatísticas, de conceituada fonte, para suplementá-lo. Complementam-no mas não lhe dão base de sustentação; e note também que, enquanto que as estatísticas são da Universidade de Cornell, as conclusões não o são, ainda que um leitor apressado assim o julgue. Aqui, de novo, uma correlação real foi usada para apoiar uma relação de causa e efeito não comprovada. Talvez tudo funcione de outro modo, e aquelas mulheres permanecessem solteiras mesmo que não houvessem cursado a faculdade. Se essas possibilidades não são melhores que a sustentada pelo escritor, talvez sejam conclusões igualmente validas: isto é, meras suposições. Há, sem dúvida, uma evidência sugerindo que uma propensão para o celibato leva a pessoa a cursar faculdades. O dr. Kinsey parece haver encontrado alguma correlação entre sexualidade e educação, talvez com características fixadas na idade pré-universitária. Isso torna mais duvidoso ainda dizer que ir à faculdade atrapalha o caminho do casamento. Susie Brown: acredite-me, isto não é necessariamente verdade. Um artigo médico apontou certa vez, com grande alarme, um aumento de câncer entre os consumidores de leite. O câncer, parece, apresentava crescimento frequente na Nova Inglaterra, Minnesota, Wisconsin e Suíça, onde grande quantidade de leite é produzido e consumido, enquanto permanecia raro no Ceilâo, onde o leite é escasso. Para maior evidência, foi apontado ser o câncer menos frequente em alguns estados do sul, onde menos leite era consumido. Foi também apontado que as inglesas que bebiam leite sofriam de certos tipos de câncer dezoito vezes mais frequentemente do que as japonesas que raramente bebem leite. Cavando um pouco, podemos desenterrar um certo número de caminhos para descobrir de onde vêm esses números, mas um fator por si só é suficiente para desmascará-los. Câncer é uma doença que atinge predominantemente da meia idade em diante. A Suíça e os estados mencionados são semelhantes em suas populações, contendo grupos de relativa idade avançada. As inglesas, na época da pesquisa, tinham em média doze anos de idade mais do que as japonesas. A professora Helen M. Walker imaginou uma divertida ilustração da bobagem de se considerar que deve haver causa e efeito, sempre que duas coisas variam juntas. Ao investigar a relação entre a idade e algumas características das mulheres, comece por medir o ângulo dos pés ao andar. Você verificará que o ângulo tende a ser maior entre as mais velhas. Primeiramente poder-se-ia considerar que isto indica que as mulheres envelhecem porque pisam para fora e pode-se imediatamente notar quanto isso é ridículo. Assim parece que, ao contrário, a idade aumenta o ângulo entre os pés, e a maioria das mulheres deve pisar mais para fora à proporção que envelhece. Qualquer conclusão desse tipo é provavelmente falsa e sem base. Você somente poderia chegar legitimamente a isso estudando a mesma mulher -- ou possivelmente grupos equivalentes -- por um período de tempo. Isso eliminaria o fator responsável, qual seja, as mulheres mais idosas cresceram numa época onde era moda pisar para fora, enquanto as do grupo mais jovem aprenderam a postura numa época onde isto foi abandonado... Ao achar alguém -- normalmente a parte interessada -- defendendo muito uma correlação, veja primeiro se não é daquele tipo produzida pela corrente de acontecimentos no curso do tempo. Em nossa época é fácil mostrar uma correlação positiva entre qualquer par de coisas tais como: número de estudantes na universidade, números de internados em casas de saúde, consumo de cigarros, incidência de doenças do coração, uso de máquinas de raios-X, fabricação de dentaduras postiças, salário dos professores da Califórnia, lucro dos cassinos. Chamar algum desses de causa do outro é idiotice declarada. Mas isto é feito todo Como já notamos, evidência mais deficiente que essa -- temperada na forja da estatística até que o bom senso não pudesse mais penetrar -- tem produzido muita fortuna médica e muito artigo médico nas revistas, inclusive profissionais. Observadores mais sofisticados esclareceram as coisas nas Novas Hébridas. Como foi notado, quase todos lá tinham piolhos a maior parte do tempo. Era, você poderia argumentar, a condição normal do homem. Quando, todavia, alguém apanhava uma febre (bem possivelmente trazida por esse mesmo piolho) e seu corpo esquentava demais para ser uma habitação confortável, o piolho ia embora. Aí você tem causa e efeito lado a lado, confusamente distorcidos, invertidos e entrelaçados. CAPÍTULO 9 COMO ESTATISTICULIZAR Mal informar o povo pelo uso de matéria estatística poder-se-ia chamar A SOMBRA OBSCURECEDORA O OESTR| (ESTILO LESTE) PARA MOSTRAR QUE NÃO ESTAMOS MENTINDO ADICIONAMOS MARYLAND, DELAWARE E ROD ISLAND DE CONTRAPESO Este mapa é um esforço particularmente flagrante para enganar, por usar um truque surrado. É algo clássico. O mesmo Banco, há bastante tempo, publicou versões desse mapa para mostrar os gastos federais em 1929 e 1937, e estes reapareceram como horríveis exemplos num livro padrão: Graphic Presentation (Apresentação de Gráficos), por Willard Cope Brinton. Este método "distorce os fatos", disse Brinton francamente. Mas o Banco de Boston continua a desenhar seus mapas e o Newsweek e outros, que deveriam melhor saber - e possivelmente o sabem - continuam a reproduzí-los sem ressalvas ou desculpas. Qual a renda média das familias americanas? Como notamos anteriormente, para 1949, o Bureau do Censo diz que "a renda da família média era de $3.100". Mas lendo um artigo de jornal sobre "doação filantrópica," feita pela Fundação Russel Sage, vemos que, para o mesmo ano, a renda atingiu um notável $5.004. Possivelmente você ficaria satisfeito em saber que as pessoas estavam ganhando tão bem, mas deve ter se espantado ao comparar aquele número com suas próprias observações. Provavelmente você conhece as pessoas erradas. Como pode Russel Sage e o Bureau do Censo estarem tão longe um do outro? O Bureau fala em médianas, como deveria ser, é claro, mas, mesmo se o pessoal da Sage estivesse usando uma média, a diferença não deveria ser tão grande. A Fundação Russel Sage, foi revelado depois, descobriu essa notável prosperidade apresentando o que só pode ser descrito como uma falsa família. Seu método, explicam (quando se lhes pede explicação), foi dividir o total da renda do povo americano por 149.000.000 para conseguir uma média de $ 1.251 para cada pessoa. "A qual", acrescentam, "torna-se $5.004 numa família de quatro". Essa curiosa peça de manipulação estatística exagera de duas maneiras. Usa o tipo de meio-termo chamado média, em vez da menor e mais informativa mediana... algo que já tratamos em capítulo anterior. Continua então supondo que a renda de uma familia esteja na razão direta de seu tamanho. Bem, eu tenho quatro filhos e gostaria que as coisas ocorressem daquela forma, mas não ocorrem. Famílias de quatro, de maneira alguma, tem comumente o dobro das posses das famílias de dois membros. COMO GANHAR $ 22.500 POR ANO (BRUTO) 1. Adquira pelo menos 1 (uma) esposa e 13 filhos. 2. Calcule a renda per capita dos EUA (Resp.: $ 1.500 por ano, aproximadamente) 3. Multiplique por 15 (Resp.: 15 x $1.500 = $22.500)
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved