Cisnes negros

Para melhor se orientar em um mundo de incertezas e de manipulação midiática, pode ser útil desenvolver a cognição programando alguns conceitos chave em suas redes neurais e estar preparado para reconhece-los. Vão aqui algumas dicas, e o leitor pode aproveitar para se familiarizar com alguns elementos da filosofia do Instituto Stokastos…

Raciocinando com incertezas

Raciocinando com causalidade

Precisamos do valor p?

Cisnes negros

É natural da mente humana procurar padrões nas coisas e nos acontecimentos. Este é o fundamento do conhecimento e das descobertas. É assim que descobrimos as “leis da natureza” e, com base na recorrência de padrões, prevemos coisas e projetamos ações futuras. Contudo, há eventos que desconhecemos seja devido à sua raridade, seja devido ao seu caráter inusitado e inesperado, e que não temos conhecimento algum sobre eles que nos permitam defini-los dentro de algum padrão. Nassim Taleb (*) chamou este tipo de evento de “cisne negro”. A expressão alude à antiga crença de que todos os cisnes eram brancos… até que se descobriu a existência de cisnes negros na Austrália, quando esse continente começou a ser colonizado.

Um cisne negro é algo fora de “nossa realidade”, estranho à nossa cognição, que nos surpreende e confunde. Ele possui as seguintes características:

  1. Um evento muito raro, fora da experiência histórica, portanto impensável até que aconteça;
  2. Não se aplicam a ele os métodos de inferência estatística;
  3. Causa um grande impacto na vida das pessoas direta ou indiretamente envolvidas;
  4. Não é previsível, só tomamos conhecimento dele quando ocorre e então formulamos teorias a seu respeito.

Um exemplo recente de cisne negro foi o aparecimento do  vírus zika com alto potencial teratogênico no Brasil. Outros exemplos de cisnes negros são: a Peste Negra; a epidemia que quase destruiu o Brasil colonial em 1685; as 10 Pragas do Egito; a reviravolta econômica provocada pelo aplicativo Über; o impacto na opinião pública brasileira causado pela Operação Lava Jato; etc. Também descobertas inusitadas são cisnes negros, como a descoberta da penicilina, a criação da Internet, o Google, a invenção do iPhone etc.

(*) Nassim Nicholas Taleb. The Black Swam, New York: Random House, 2007. (Há tradução nacional)

O peru indutivista de Russel

Bertrand Russel mostrou como o raciocínio indutivo baseado na observação acumulada pode levar a conclusões falaciosas. Ele alerta sobre os perigos da indução numa deliciosa fábula.

Um peru foi colocado em um lugar agradável e calmo. Ele passou a ter uma vida tranquila e feliz. Tudo era previsível, e ele não tinha preocupações. Todos os dias da semana era pontualmente alimentado às 9 horas da manhã, fazia exercícios num amplo quintal, almoçava, jantava, dormia em um lugar confortável. Todo dia era a mesma coisa. Uma bela vida. Ele engordava e até filosofava.

E assim os dias, as semanas e os meses passavam.

Sendo um bom indutivista, o eminente peru não tirou conclusões apressadas. Continuou suas observações por semanas a fio, e somente depois de constatar que aquele padrão repetia-se sempre, não importando o clima ou o que quer que seja, concluiu que seu futuro seria o melhor possível, uma vida longeva e pacífica, com alimentação certa e um bom lugar para ciscar e repousar.

Um ano depois, na véspera do Natal, o peru acordou e – céus! – não haviam servido sua refeição. Alguém chegou e o agarrou bruscamente, e ele nem teve tempo de protestar. Cortaram-lhe o pescoço. Era a ceia de Natal.

Acreditamos que se as coisas sempre vão bem no passado, tudo será a mesma coisa no futuro. Nosso emprego, a aposentadoria, nossa propriedade, mas de repente, tudo pode inexplicavelmente mudar. Os matemáticos conhecem bem isso: basta uma única exceção em milhares de resultados para invalidar definitivamente uma prova. Raciocinar com probabilidades considerando sempre que uma teoria, por melhor que seja, poderá vir algum dia mostrar-se falsa, é uma atitude não somente de prudência, mas genuinamente cientifica. O pobre peru indutivista nos ensina que basta uma única contraprova para derrubar uma teoria cientifica que perdurou por séculos.

Porque precisamos de probabilidades e estatísticas?

Suponha que temos uma enorme caixa cheia de bolas de pingue-pongue. Um observador sorteia 10 bolas e verifica que todas elas são brancas, sorteia outras 10 e encontra o mesmo resultado e repete isso mas oito vezes e consta a mesma coisa. Ele conclui então que a caixa contém bolas brancas. Ao abrir a caixa, verificou-se que esta continha 1000 bolas, das quais 20 eram vermelhas, portanto a população era em sua maioria branca, com algumas bolas vermelhas.

Isso ilustra o perigo de generalizar por indução. O pesquisador foi imprudente ao afirma que todas as bolas eram brancas, ele deveria dizer “a menos que alguma nova observação prove o contrário, a evidências sugerem que a população de bolas na caixa parece ser de cor branca”, ou “nas condições em que realizamos nossas observações, limitadas a dez amostras, constatamos que as bolas eram brancas, salvo prova em contrário”.

O método indutivo, contudo, é fundamental em ciência, pois, não podemos examinar todo o universo para extrair conclusões deles. Foi para evitar afirmações falsas que o método indutivo foi reciclado como Teoria das Probabilidades e Estatística, pois assim é possível extrair conclusões sem eliminar a incerteza da mesma, estimando probabilisticamente o risco de uma afirmação falsa.

Lógica, formulação de hipóteses e raciocínio indutivo

É impossível acessar o todo em seu conjunto, e por isso frequentemente extraímos conclusões a partir de uma parte do mesmo. Em outras palavras, somos obrigados a usar o raciocínio indutivo (inferência indutiva). É natural fazermos inferências falsas, e por isso precisamos conhecer um pouco de lógica para reduzirmos a margem de erro, eliminando aqueles que podem ser evitados.

Proposições são sentenças simples definidas como verdadeiras ou falsas. Por exemplo, “o homem voa” é uma sentença falsa, mas “os pássaros voam”, é verdadeira (embora pinguins e avestruzes não o façam). A lógica começa a operar quando juntamos proposições para sabermos se a sentença formada é verdadeira ou falsa ou inconclusa. Considere P e Q duas proposições formando a sentença “se P então Q” (Q decorre de P). P é também chamado de “hipótese” e Q o “resultado”. Há três conclusões possíveis:

  • Se P é verdadeira, então Q é verdadeira;
  • Se P é verdadeira, então Q não pode ser verdadeira;
  • P e Q são independentes.

Vejamos alguns exemplos. No primeiro caso:

  • P: (Hipótese) Todos os cães são mamíferos;
  • Q: (Teste) Meu cão é um mamífero (conclusão constatável).

Neste caso Q decorre logicamente de P. No segundo caso temos:

  • P: Todos os mamíferos são alados;
  • Q: Meu cão não tem asas (conclusão constatável, pois o morcego é um mamífero alado).

Neste caso, Q conflita com P, então ou P é falsa ou Q é falsa, ou ambas são falsas. De qualquer forma, ambas não podem ser verdadeiras. Vejamos o terceiro caso:

  • P: Todos os mamíferos têm asas;
  • Q: Meu cão tem asas (conclusão falaciosa, pois só o morcego tem asas).

Neste caso também Q decorre de P, porém, ambos os enunciados são falsos (pois se o meu cão tem asas, então não é um cão). Se P fosse verdadeiro, então Q também o seria, o que não é o caso, já que sei como é o meu cão. Por outro lado, sendo P um enunciado geral, não podemos prová-lo a partir de Q, que é um caso particular, senão apenas negá-lo.

P é sempre uma premissa (proposição) geral ou universal, ou seja, uma hipótese, e Q é uma premissa (proposição) particular, um resultado ou um fato observado. Não é possível provar P a partir de um fato particular, mas somente negá-lo, pois basta uma exceção (em Q) para negar uma generalização. Isto mostra que o raciocínio indutivo ou generalizador – que parte do particular para o geral – é inútil como prova, pois não pode provar a universalidade de algo. Em outras palavras, o que o raciocínio indutivo pode fazer é apenas negar uma proposição geral, nunca afirmá-la.

A vantagem de formular P, a hipótese, é que ela pode ser testada pela experimentação, e se Q não decorrer dela, então a abandonamos, do contrário prosseguiremos detalhando mais experimentos para se chegar a uma conclusão mais consistente. Ao se formular uma hipótese devemos ter os seguintes cuidados ao usar relações lógicas simples:

  • Dos quantificadores lógicos “todos”, “nenhum” e “algum”, devemos evitar este último, pois não leva a resultados conclusivos. Se for o caso, ele pode ser substituído pelo “todos” para refinar a hipótese, mas sem entrar em minúcias excessivas. Exemplos, as hipóteses “algumas bactérias são inibidas pela penicilina”, “algumas indivíduos que sofrem de depressão se suicidam”, devem ser substituídas por “bactérias gram-positivas sem exposição prévia a qualquer tipo de antibiótico são sensíveis à penicilicina”, “o transtorno depressivo maior tem o suicídio como fator de risco em relação à população geral”.
  • “Se”, “a menos que” são relações lógicas que descrevem eventos ocorrendo simultaneamente. Esses elementos devem ser evitados, a menos que o pesquisador necessite enfatizar uma limitação importante na sua hipótese.
  • As relações de ordem “maior que”, “menor que” e “igual a” só devem ser usadas para generalizar uma relação de ordem quantitativamente observada. Já a relação “proporcional a” tem diferentes interpretações e precisa ser especificada no contexto, porém, ela deve ser usada tanto quanto possível para indicar uma relação quantitativa.

Por fim, a navalha de Occam (Entia non sunt multiplicanda praeter necessitatem) nos orientará, na medida do possível, a evitar hipóteses complicadas e interpretações pomposas de resultados.

Lógica em um mundo difuso

A lógica é um método para determinar se a construção de um argumento é aceitável ou não. Mais importante que isto, ela nos serve como um detector de argumentos falaciosos. Classicamente, a lógica admite somente dois valores: verdadeiro ou falso, não existindo uma terceira possibilidade: ou uma coisa é verdadeira ou ela é falsa. Entretanto, no mundo dos fatos, os conceitos de verdadeiro e falso não têm muita utilidade. Nem tudo é preto e branco; tomamos decisões numa zona cinzenta. Considere o silogismo (conclusão baseada em duas premissas, a maior ou geral, e a menor ou particular):

Pedro é uma ave
As aves voam
Logo, Pedro voa

A sentença é logicamente verdadeira (se Pedro é uma ave… então Pedro voa), como no caso “se a e b são números naturais, então a+b é o mesmo que b+a”.  Entretanto, sabemos que há aves que não voam, como avestruzes, pinguins e aves empalhadas, assim, para afirmar algo precisamos estabelecer condições. No nosso exemplo, devemos considerar se as aves do argumento são “aves da floresta” (que via de regra voam) ou “aves do pólo sul” (que muito provavelmente não voam, como os pinguins). Então, Se Pedro é uma ave, devemos especificar se é da floresta ou do pólo sul, e se for da floresta, concluímos então que eleprovavelmente voa. Observe que, ao dizer que é “verdade”, estamos nos referindo a algo que é provável, mas não totalmente certo. O raciocínio indutivo tem suas armadilhas…

Outro problema que a lógica clássica não trata é a imprecisão de nossa linguagem, e isto pode levar a paradoxos (argumentos que nunca concluem). Tal fato levou os matemáticos a rever a teoria dos conjuntos, cujos argumentos eram instrumentais na prova de importantes teoremas. Numa cidade só há um barbeiro, e nesta cidade há dois conjuntos de homens: os que se barbeiam sozinhos e os que não se barbeiam sozinhos. Isto está bem claro até se perguntar: em que conjunto colocamos o barbeiro? Quem faz a barba dos homens que não se barbeiam sozinhos é o barbeiro, logo ele faz parte desse conjunto, então ele deve procurar um barbeiro para fazer sua própria barba, que é ele mesmo, então ele faz parte do conjunto dos que se barbeiam sozinhos. Conclui-se que ele não se barbeia e se barbeia, o que é um paradoxo. Russel quis mostrar que teorizações com base em conjuntos de conjuntos podem levar a contradições. Gödel posteriormente provou que tais paradoxos não são próprios apenas da linguagem comum, mas existem dentro da lógica axiomática, e assim, dentro da própria matemática.

Também a lógica do falso/verdadeiro pode levar a problemas, pois nos leva ao raciocínio de que uma coisa exclui a outra. Ora, quando o serviço de meteorologia nos avisa que a probabilidade de chover amanhã será de 70%, então a primeira coisa a fazer é se preparar para sair com o guarda chuva. Aqui levamos em conta que a situação “chove/não chove” não é mutuamente exclusiva, embora não possamos afirmar com segurança qual delas ocorrerá. No mundo real a lógica é cinzenta, nem totalmente branca e nem totalmente preta, ou seja, nem totalmente falsa e nem totalmente verdadeira. Estamos acostumados a pensar em preto e branco em um mundo que é, na verdade, cinza, onde as coisas não são absolutas, mas contextualizadas. Portanto, a lógica clássica dá lugar a uma lógica difusa (fuzzy).

Se quisermos separar os conjuntos dos indivíduos altos e baixos teremos dificuldade em separá-los precisamente porque não existe uma linha divisória clara entre eles. Um sujeito com 1,90 m é muito alto e outro com 1,50 é muito baixo, mas para decidir se um indivíduo com 1,70 é alto ou baixo será necessário estabelecer um critério dentro de um contexto. Um individuo com 1,70 pode ser considerado alto numa população da Indonésia, mas baixo numa população de jogadores de basquete.

A lógica difusa tem uma larga aplicação na construção de máquinas “espertas”. Um exemplo são as máquinas de lavar que regulam sua quantidade de água, sabão e outros ingredientes de acordo como o volume de roupas e o tipo de sujeira predominante; ou as luzes das ruas que se acendem segundo a claridade do dia; a TV que regula seu brilho e contraste segundo o movimento da imagem; a câmera que regula seu foco e abertura em função do objeto à sua frente; etc.

Na lógica real nem tudo é totalmente verdade ou totalmente falso, as coisas não ligam e desligam simplesmente. Em ciência sabemos hoje que toda teoria, dedução ou modelo não são absolutamente certos, e as julgamos pela sua utilidade. Quanto mais raciocinamos dentro da lógica clássica, mais nos afastamos da situação real.

Causalidade

Define-se “causa” como aquilo que produz algo ou participa de sua produção. A noção de causa foi primeiramente enunciada por Platão no diálogo Timeue em algumas passagens de A República.

Se um fenômeno decorre de outro, este é denominado causa e aquele efeito. Este é o “princípio da causalidade”, que pode ser enunciado assim: “as mesmas causas produzem os mesmos efeitos”. Toda explicação baseada no conhecimento do encadeamento de causas e efeitos é “mecanicista”, pois estabelece um “mecanismo”, uma explicação convincente. Esta forma de conhecimento veio com a Revolução Científica, culminando na Física de Newton, e influenciou a partir daí diferentes campos do conhecimento que reivindicaram para si o status de ciência.

Na maioria das vezes uma investigação cientifica procura descobrir a causa para um dado fenômeno, e isto não é algo simples, pois nem sempre há uma relação direta entre causa e efeito. Outras vezes, a causa, estando presente, nem sempre leva ao efeito, ou seja, ela é necessária (pois na sua ausência o efeito nunca é observado) mas não suficiente. Se o bacilo de Koch está presente no pulmão de um indivíduo, ele terá tuberculose, mas não necessariamente.

Por outro lado, nem sempre a relação causa-efeito é encontrada. Muitas vezes demonstramos se há uma correlação (associação) significativa entre um fato e outro, e isso não é uma prova de causalidade direta ou indireta. Correlação não é causa, mas serve para estimar riscos. Desse modo, fatores de risco tornam-se um instrumento importante nas políticas de proteção à saúde e meio ambiente.

A identificação de uma causa implica em saber como é possível controlá-la. Por exemplo, sabendo-se que a varíola é causada por um vírus e que produz imunidade duradoura, é possível controlar a doença através de vacinação.

O que é um processo estocástico?

Na maioria das vezes não podemos identificar causalidades, e na maioria das vezes lidamos com situações não determinadas, mas com variável grau de incerteza. Em outras palavras, o mundo não é determinístico como as equações mecânicas de Newton, mas probabilístico. É importante conhecer um pouco de estocasticidade.

Um processo estocástico é uma família de variáveis aleatórias que representam a evolução do estado de um sistema com o tempo. Geralmente representada por Xt, sendo t = 0, 1, 2, …, n (t ∈ ℕ), caracterizando um processo estocástico discreto, isto é, em que as observações são feitas em intervalos finitos de tempo. Portanto, ele descreve um sistema com algum grau de indeterminação, probabilístico, contrapondo-se aos processos determinísticos, que são aqueles que, uma vez conhecido seus valores de estado em um dado ponto, podemos prever sua evolução futura ou passada. Em um processo estocástico, mesmo que se conheça seus valores de estado em um dado ponto, as possibilidades de sua evolução futura é indeterminada e seu passado não pode ser refeito.

De um modo geral, todo tipo de evolução temporal, determinística ou probabilística, que seja modelável com base em probabilidades pode ser considerado como um processo estocástico.

Os diferentes valores ou categorias de estado do sistema e as respectivas probabilidades associadas ocupam um mesmo espaço amostral chamado espaço de estados. A temporalidade do processo é o fenômeno mais comum, porém, outros parâmetros podem ser usados. São exemplo de processos estocásticos o curso de uma epidemia, a distribuição de um gene em populações, o curso de uma negociação diplomática, a temperatura histórica do planeta, flutuações no mercado de ações e nas taxas de cambio, o clima, evolução dos sinais vitais em um paciente na UTI, etc.

Um processo estocástico muito comum e largamente utilizado em modelagem são as cadeias (ou processos) de Markov. Este processo é amplamente utilizado em modelagem científica, e também em planejamento e decisões.

Veja também

Portela Câmara F. Epidemiologia para psiquiatras, PROPSIQ, Porto Alegre: Artmed/Panamericana Ed., ISSN 2237-4426, ciclo 1, vol. 2, pp. 9-39, 2012.