Matéria escura, teorias de cordas topológicas e interações eletrofracas.

Sexta-Feira, 18 Dez 2009; Week 51 Rafael Lopes de Sa 2 comentários

E eis, em termos quase leigos, a notícia por qual todo mundo estava ávido essa semana: Latest results of CDMS-II, December 17, 2009. Eu não entendo muito bem que informação tão valiosa pode-se tirar com a quantidade de colisão elásticas com núcleos, mas tudo bem: há dois eventos que clama-se ser matéria escura.

Eu sei que muito já foi anunciado por aqui, mas anunciando mais uma vez. O LHC foi ligado e está indo muito bem obrigado. A colaboração do ALICE, apressada, até publicou um artigo no arXiv. Claro que nenhuma física nova, mas para dizer que está tudo correndo bem. Ainda há muito trabalho a ser feito antes de qualquer resultado, mas as perspectivas são empolgantes. Esses próximos dez anos serão extremamente excitantes para física de altas energias, sem dúvida. Contudo, ainda serão necessário mais uns quatro ou cinco anos de trabalho até se ter, por exemplo, uma descoberta do Higgs.

Nas duas notícias acima temos essa frase “alguém descobriu alguma coisa”. O que isso significa? Físicos de altas energias (esses que ficam construindo modelos e procurando partículas, matéria escura e afins) tem uma definição razoavelmente precisa do que isso significa. Bem, mesmo com o risco de falar besteiras, vou tentar explicar:

Eu vou ser um pouco abusado e dizer que tudo começa com uma lagrangiana para uma teoria de campos. Isso pode não ser completamente verdade hoje em dia, mas vamos em frente. Desse modelo dado por uma lagrangiana, você constrói funções de correlação. Nem sempre sabemos calcular essas funções, mas vamos fingir que sabemos. A partir delas podemos construir matrizes de espalhamento e a seções de choque para um certo processo. A seção de choque é a probabilidade de um certo evento acontecer. Por exemplo, vamos dizer que que o nosso processo seja a interação de dois prótons gerando dois fótons e mais qualquer outra coisa (as vezes chamado processo inclusivo, por conter esse qualquer outra coisa). Ok, mas como vamos ver esses dois fótons? Aí que entram os detectores de partículas, como os experimentos do LHC ou o CDMSii falados nesse post. O problema é que esses detectores são suficiente complexos para não ser possível construir analiticamente uma função da seção de choque que resullte no sinal no detector. O que se faz então é criar modelos numéricos de como acontece essa interação dos eventos com o detector, que no fim é o que se mede.

Por exemplo, essa interação entre prótons que gera dois fótons é ligeramente diferente se o Higgs existir ou não. Vamos chamar tudo que produz esse evento, mas que não provém do decaimento de um Higgs de background b, e vamos chamar a constribuição do Higgs de s, o sinal. A idéia de fazer uma boa medida é escolher quantidades para se medir em que o sinal seja puro e eficiente, ou seja, voce quer pegar o máximo de eventos produzidos por Higgs mas ao mesmo tempo pegando o mínimo de background. Existem diversas formas de se maximizar a capacidade de um experimento fazendo boas decisões do que se deve olhar, e a física de altas energias tem se beneficiado bastante de todo o conhecimento de Machine Learning que foi desenvolvido num contexto completamente diferente.

Bem, vamos voltar ao assunto. Então, a hipótese nula, ie, a hipótese de que o Higgs não existe é dada por s=0. A pergunta é: qual é a probabilidade de observar dados de compatibilidade igual ou menor com a hipótese nula do que com os dados que foram observados. Para dar um exemplo mais concreto, se estamos considerando contagens num detector, como um calorímetro por exemplo, a distribuicao de b+s vai ser uma Poisson. Vamos também supor que foram vistos 100 eventos que geraram dois fótons e que a nossa seleção de eventos é boa e esperamos um background de 10 eventos. A probabilidade que eu falei acima será:

Poisson (n\geq 100,\lambda =10)

Físicos dizem que isso corresponde a uma descoberta, por exemplo, do Higgs, se essa probabilidade for menor do que a área de uma gaussiana fora do intervalor de 5\sigma. Essa área é de aproximadamente 5.7\cdot 10^{-7}. Nesse caso em especifico onde contagem é sempre algo positivo, isso é 2.8\cdot 10^{-7}. Voce vê que isso é uma estimativa bem conservadora (NB: Eu não disse que a distribuição de probabilidade é gaussiana! Para eventos raros, onde a contagem é pequena, ela não vai ser! Só se traduz em números de desvios padrões que dariam a mesma probabilidade cumulativa se a distribuição fosse gaussiana)

Vamos, para ficar ainda mais claro, tomar como exemplo um lançamento de uma moeda que pode dar cara ou coroa. E você perguntaria a um fisico de altas energias se essa moeda é viciada ou não. Entao digamos que você não é uma pessoa muito paciente e jogou a moeda 20 vezes para cima e anotou os resultados. Abaixo eu vou fazer uma tabela da probabilidade descrita no paragrafo anterior, chamado valor p, com a hipotese nula agora correspondendo à metade das medições como cara e metade coroa, para um certo número de resultados idênticos obtidos.

0 1.91\cdot 10^{-6}
1 4.01\cdot 10^{-5}
2 4.02\cdot 10^{-3}
3 0.003
4 0.019
5 0.041
6 0.115
7 0.263
8 0.503
9 0.823

O físico que você contratou, mesmo que o resultado absurdo de 20 caras e nenhuma coroa saísse, ele não se daria por satisfeito em dizer que descobriu que a moeda está viciada. Neste caso ele precisaria jogar a moeda no minimo 24 vezes e ainda assim ele só estaria satisfeito se todos os resultados fossem iguais.

Essa é a idéia do porquê construiram o LHC. O problema nao é exatamente ter energia para se produzir o Higgs, isso o Tevatron no Fermilab também tem. O valor mais provável para massa do Higgs é em torno de 100\, GeV e em nível partônico o que acontece no Tevatron são colisão de glúons que em média tem energia maior que isso. A questão é que a quantidade de eventos produzidos nunca seria suficiente para ter esse nível de certeza. Então o LHC é uma máquina construída para gerar muitos desses eventos (esse parâmetro chama-se luminosidade), de forma que possamos escolher canais mais limpos para se observar e daí termos certeza da descoberta. O Atlas, um dos experimentos do LHC, tem como seu canal de procura principal o decaimento do Higgs para dois fótons, que eu usei como exemplo aqui. Esse decaimento é extremamente raro, mas quando é produzido é fácil de se identificado com alta eficiência e pureza.

Mudando um pouco de assuntos, falando sobre teoria de supercordas, quase todos os exemplos de teoria de cordas topológicas sao de uma certa forma triviais, da mesma forma que a teoria de campos da folha mundo de uma supercorda é trivial. Agora, se voce olhar para a supercorda num background de AdS_5 \times S^5 é facil ver que ela é um sistema interagente, e nesse sentido não trivial. Será que aquela ação topológia que Berkovits e Vafa escreveram para supercorda em AdS_5 \times S^5 no limite do raio de AdS tendendo à zero não seria um novo tipo de corda topológia não trivial? Pela conjectura de AdS/CFT essa supercorda topológica deveria ser {\mathcal N}=4 SYM livre. Teorias não-abelianas livres não são tão triviais quanto as teorias abelianas, mas eu não entendo muito bem dessas não trivialidades. Contudo, eu acho algo interessante a se tentar entender e é um dos meus projetos atuais. O interessante seria se conseguíssemos, usando as técnicas de teoria de supercordas topológicas, entender a relação entre esses dois setores.

CategoriasArs Physica

13.7: Cosmos e Cultura

Sexta-Feira, 18 Dez 2009; Week 51 Leonardo Deixe um comentário

O nosso querido Marcelo Gleiser está iniciando um blog, em inglês, junto com outros colegas de ciência e cultura: 13.7. Além de Marcelo, o blog conta com a jornalista e autora K. C. Cole que foi jornalista científica durante muitos anos do LA Times, o astrofísico Adam Frank da Universidade de Rochester, a bióloga Ursula Goodenough da Universidade de Washington em St Louis e Stuart Kauffman, biólogo do Instituto Santa Fé. Vale a pena ler esse blog pelas matérias bem escritas e de cultura científica geral.

Realejo do dia…

Quinta-feira, 10 Dez 2009; Week 50 Daniel Deixe um comentário
The Ultimate Gaming Computer

The Ultimate Gaming Computer

A semana nos arXivs…

Quinta-feira, 10 Dez 2009; Week 50 Daniel Deixe um comentário

Transcendental Meditation

Transcendental Meditation

Atualizações do Ultra Deep Field, Planck e LHC

Quarta-feira, 9 Dez 2009; Week 50 Leonardo Deixe um comentário

Planck

Já faz algum tempo que eu gostaria de passar a notícia (atrasada) que o satélite Planck vai bem, obrigado. No presente momento, o cronograma atualizado da missão espera que em 2012 os resultados das medidas precisas de anisotropia da radiação cósmica de fundo se tornem públicas.

Ultra Deep Field

Logo depois que o Hubble sofreu sua atualização este ano, a câmera do Hubble Ultra Deep Field (HUDF) permitiu detectar as primeiras galáxias com redshift z ~ 8 (o recorde era z ~ 7). E ontem a imagem do HUDF foi atualizada.

Hubble Ultra Deep Field 2009

LHC

O LHC realizou a primeira colisão de prótons a energia de 2.36 TeV.

Realejo do dia…

Terça-feira, 8 Dez 2009; Week 50 Daniel Deixe um comentário

y = exp(x)

y = exp(x)

Aquecimento global…

Terça-feira, 8 Dez 2009; Week 50 Daniel Deixe um comentário

Ultimamente, principalmente depois do “climategate“, muito tem se discutido sobre o aquecimento global. Então, eu achei que um infográfico mostrando os principais argumentos lado-a-lado, poderia ser útil,

THE CLIMATE DENIERS VS THE CONSENSUS

THE CLIMATE DENIERS VS THE CONSENSUS

É claro que ainda existem perguntas extremamente importantes e relevantes acerca do papel das algas, dos plânctons (produção de oxigênio), dos corais, das nuvens (reflexão dos raios solares), e do ciclo do nitrogênio e do ciclo do metano. Mas, não é por isso que aquilo que já se sabe deve ser descartado. :razz:

O realejo do dia…

Sexta-Feira, 4 Dez 2009; Week 49 Daniel Deixe um comentário

Penrose Chess

Penrose Chess (deveria ser "Escher" também :wink: )

Fofoca do CDMS…

Quinta-feira, 3 Dez 2009; Week 49 Daniel 11 comentários

Fofoca de Física é punk… :cool:

Mas, anda correndo na boca miúda… que o CDMS está prestes a fazer um “anúncio público” no dia 18 de Dezembro (exatos 15 dias de hoje)! Inclusive, continua a fufuca, com direito a artigo publicado na Nature e tudo mais. :twisted:

Não dá pra contar a fonte, claro (senão, não seria fufuca :wink: ), … mas, dá pra dizer que a notícia veio desde o “alto escalão“, do “alto clero“, direto pros mortais…

:twisted:

Fiquem ligados!

Google Public DNS…

Quinta-feira, 3 Dez 2009; Week 49 Daniel Deixe um comentário

Hoje o Google pôs no ar um serviço de DNS,

A TechCrunch tem alguns comentários em Google Gets Into The DNS Business. Here’s What That Means; e o LifeHacker também tem alguns comentários, Google Public DNS Aims to Speed Up Your Browsing [DNS].

Vale a pena dar uma testada: os benchmarks que eu fiz por aqui foram bastante positivos. (E, claro, eu me empolguei um pouco… :wink: )

Fora isso, uma notícia um tanto inusitada, também vindo do Google,

Ou seja, os caras preferem evitar contratações “em massa”, pra garantir o bom equilíbrio do “ecossistema” chamado “mercado”. :cool:

Atualizado (2009-Dec-03 @ 14:26h): Agora o Slashdot está dando a notícia também, Google Launches Public DNS Resolver. (Sim, estou repassando esta notícia em tempo real! :twisted: )

E pra quem estiver interessado em dar uma “tunada” no próprio site, eis outra diquinha,

Diversão garantida… :cool:

A semana nos arXivs…

Quarta-feira, 2 Dez 2009; Week 49 Daniel Deixe um comentário

Encontrado um análogo da QCD?

Segunda-feira, 30 Nov 2009; Week 49 Leonardo Deixe um comentário

Quando cheguei a Dartmouth, o meu primeiro projeto de pesquisa envolveu uma aplicação cosmológica do modelo do Schwinger, que é a versão em 1 dimensão espacial da eletrodinâmica quântica (QED 1+1 daqui para frente). Uma das coisas belas de teorias quânticas de partículas em 1 dimensão espacial é que as integrais de trajetória tem formas fechadas, permitindo calcular todos os observáveis em forma exata. Curiosamente, a QED 1+1 tem integrais de trajetórias idênticas a teoria de um méson escalar com um potencial tipo co-seno. Mais ainda, quando o valor do acoplamento do férmion com o fóton é não-perturbativo (i.e. a interação é forte), o acoplamento do méson é perturbativo (i.e. a interação entre mésons é fraca), e vice-versa, ou seja, se e_\mu é o valor da carga elétrica medida na escala de energia \mu e \lambda_\mu é o valor do acoplamento do campo escalar medido na mesma escala de energia, esses dois se relacionam na forma e_\mu \propto 1/\lambda_\mu. Notando esse fato, Sidney Coleman observou que tinha-se na verdade uma teoria em 1 dimensão que se comporta analogamente a QCD (a teoria das forças nucleares fortes), e não a QED, pois para energias altas em que o acoplamento e_\mu é fraco, a teoria pode ser vista como a teoria de um férmion acoplado com um bóson de gauge, mas a energias baixas, e_\mu se torna grande, a interação férmion-férmion intermediada pelo bóson de gauge confina essa partícula a existir apenas na forma de bósons de spin 0 (o campo escalar). Isso é idêntico ao que acontece na QCD em que o par de quarks up e down confina quando cada quark tem energia E < 240 MeV para formar o os três píons, \pi^0\, , \pi^+ \, ,\pi^- — a física desses últimos é descrita por campos escalares ao invés de férmions de spin 1/2 e glúons.

Relacionado a essa questão, eu fiquei curioso em saber se existia um sistema da matéria condensada que fosse descrito pelo modelo de Schwinger, algum sistema eletromagnético efetivamente de 1 dimensão espacial. Bom, parece que estes senhores encontraram um tal sistema em 1996: Phys. Rev. B 53, 8521 – 8532 (1996), que foi experimentalmente realizado recentemente, com um relatório publicado na Nature Physics ontem.

Leia mais…

LHC: 2.36 TeV

Segunda-feira, 30 Nov 2009; Week 49 Leonardo Deixe um comentário
Monitor na sala de controle do feixe do LHC mostra 1.17 TeV por feixe de prótons. Hoje o acelerador alcançou a marca de 1.18 TeV por feixe.

Aconteceu hoje: o LHC superou a marca de 1.96 TeV do Fermilab operando a uma energia combinada de 2.36 TeV dos dois feixes de prótons no anel principal! Eba! :) Nos primeiros quatro meses de 2010, a equipe do feixe do LHC pretende acelerar os prótons a uma energia combinada de 7 TeV (energia do centro de massa). O objetivo é chegar a 14 TeV no centro de massa, ou seja 7 TeV em cada próton (no referencial do laboratório). Cada quark e glúon do próton terá uma energia de aproximadamente 1 TeV, fazendo o LHC um acelerador de partículas que colide quarks e glúons juntos a energias de aproximadamente 2 TeV. Essa energia é convertida no produto de decaimento das colisões quarks e glúons, e permite janela suficiente para produzir o bóson de Higgs, que deve ter da ordem de 100 GeV/c2 de massa — uma partícula elementar de massa próxima aos núcleos naturais mais pesados, como o rádio.

Notícia completa: CERN.

Crédito das fotos: CERN.

Comissão de feixe do LHC comemora o controle do feixe estável a alta energia.

Como começou a expansão do universo?

Quarta-feira, 25 Nov 2009; Week 48 Leonardo 1 comentário

Lendo artigos de um grupo de cosmólogos teóricos bem ativos na atualidade, eu cruzei com a observação interessante levantada por Paolo Cremineli, Leonardo Senatore, Markus Luty e Alberto Nicolis, de que na teoria da gravitação atual, a taxa da expansão do universo sempre diminui. A taxa de expansão é o que se chama o parâmetro de Hubble, H. As galáxias relativamente próximas a nós estão se afastando com uma velocidade que é proporcional ao valor atual de H vezes a distância: v = Hatuald. Quanto maior H, mais rápido as galáxias a uma dada distância d se afastam.

Para teorias de campos que respeitam o princípio de relatividade e que possuem apenas soluções estáveis, a variação do parâmetro de Hubble no tempo é sempre negativa:

\Delta H/\Delta t < 0

que está de acordo com a idéia que a gravitação é atrativa. Portanto, mesmo em um universo com expansão acelerada, o que significa que a taxa da variação da distância média entre galáxias aumenta com o tempo, a taxa de expansão do universo diminui com o tempo, e portanto a gravitação de fato desacelera a expansão. Isso é importante porque garante, entre outras coisas, que a gravidade pode atrair matéria para uma região do espaço e formar aglomerados, como as galáxias. Essa condição também assegura que exista um mínimo para a energia do conteúdo do universo, o que se traduz no importante fato de que existe um estado de vácuo estável em cada instante, e que partículas não podem ser criadas do nada sem custo de energia. Em poucas palavras, garante certos critérios de estabilidade física da teoria.

No universo primordial H tinha um certo valor HI maior que o atual, mas se imaginarmos ingenuamente que a expansão do universo deveria ter começado com um processo físico que gradualmente levou o valor de H de zero para HI, precisamos que a variação no tempo de H possa ser positiva, pelo menos no momento da origem do universo. Isso não quer dizer que essa visão ingênua esteja certa, mas seria de fato interessante estudar a possibilidade de um processo físico que leve H de zero para um valor não nulo. Mas como é possível garantir simultaneamente que H cresça no tempo e que a estabilidade física da teoria seja satisfeita?

Cremineli e os demais sugeriram o seguinte: e se nós permitimos que essa violação da estabilidade ocorra de forma controlada para escalas de tamanho sempre maiores que o raio visível do universo? Em outras palavras, seria possível obter simultaneamente uma variação positiva no tempo para H e uma teoria em que sempre em escalas de tamanho suficientemente pequenas você tem efetivamente estabilidade?

O truque reside em começar com uma teoria para a inflação que seja salutar e estudar as perturbações do campo inflacionário (o inflaton) produzidas pelas flutuações quânticas e mostrar que essas perturbações podem contribuir para H de forma a provocar \Delta H / \Delta t > 0. Porém essas perturbações todas podem ser controladas para terem tempo de vida sempre maior que a idade do universo, de modo que nenhum observador é capaz de ver os efeitos físicos da instabilidade, a não ser através de H. Que isso é de fato possível não é trivial, e eu não sei explicar sem mostrar a matemática. Nós podemos começar com uma teoria absolutamente genérica de que existe um certo campo escalar \phi que domina a densidade de energia do universo, e então mostrar que as flutuações quânticas desse campo contribuem para H de modo que a variação no tempo de H seja positiva. Para que o universo sempre possua estabilidade física dentro de todas as regiões causais, deduz-se que a escala de energia da energia escura não pode ser muito maior que aproximadamente 100 GeV. Isso não está completamente descartado uma vez que esta energia é do setor escuro da Natureza, aquele que interage muito fracamente com os prótons, elétrons, fótons, etc., a não ser gravitacionalmente. Se você lembrar de um post anterior, eu já discuti como é possível que exista interações novas da matéria escura exatamente nessa escala de energia.

Uma série de artigos técnicos sobre esse assunto são estes:
arXiv:hep-th/0606090, arXiv:0911.2701, arXiv:0811.0827.

Versão um pouco mais técnica. Visto que

\dot{H} = -4\pi G (\epsilon + p )

para equações de estado p = w \epsilon com w > -1 sempre temos \dot{H} < 0. Para obter \dot{H} > 0 é necessário violar a condição de energia nula (NEC) \epsilon + p > 0. Isso pode ser feito apenas no setor das inomogeneidades da energia e pressão, i.e. calculando-se \delta p e \delta \epsilon, sendo que \bar{\epsilon} e \bar{p}, onde a barra significa a solução homogênea e isotrópica, é sadia. Isso cria um w efetivo menor que -1, violando a NEC. Mas como \delta p e \delta \epsilon são funções do espaço, as componentes de Fourier \delta p_q e \delta \epsilon_q podem ter instabilidade apenas para números de onda q suficientemente grandes, i.e. sempre satisfazendo q/aH \ll 1. Isto é equivalente a tomar que o período característico dos modos instáveis em um instante de tempo é maior que a idade do universo naquele instante. Para evitar a instabilidade gravitacional, a freqüência de Jeans associada ao modo instável também precisa ser menor que H.

Realejo do dia…

Terça-feira, 24 Nov 2009; Week 48 Daniel Deixe um comentário

Primeira colisão de prótons do LHC ocorreu hoje

Segunda-feira, 23 Nov 2009; Week 48 Leonardo Deixe um comentário

Um dos primeiros eventos do LHC, reconstruído no detetor ALICE.

As 11h da manhã (hora de Brasília) de hoje, a primeira colisão de prótons foi detectada no LHC! Os prótons circularam a uma energia de 900 GeV (no referencial do centro de massa). O primeiro evento foi registrado a essa hora no ATLAS, depois outra colisão ocorreu no CMS e finalmente outras duas no LHCb e ALICE.

Se tudo correr bem, a comissão que está trabalhando no feixe de prótons do LHC pretende acelerar prótons a 2.4 TeV no centro de massa (CM) até o final de dezembro. Quando este dia chegar, o LHC será oficialmente o acelerador de partículas mais energético do mundo, sobrepujando o Tevatron no Fermilab que opera atualmente a 1.9 TeV no CM.

A presente fase do LHC tem dois objetivos: 1) testar o feixe de prótons no anel circular principal, como o tempo de vida dentro do anel, e 2) servir de dados iniciais para os experimentos calibrarem seus detetores. O objetivo do experimento na sua próxima fase é produzir colisões entre prótons a 14 TeV no CM, suficiente para descobrir — ou descartar a existência — o bóson de Higgs, a única partícula elementar do Modelo Padrão que ainda não foi detectada. O CMS e o ATLAS se encarregarão desta busca, assim como a análise de possíveis novas partículas não incluídas no Modelo Padrão. O LHCb estudará as reações de violação da simetria matéria-antimatéria e paridade do Modelo Padrão, o mecanismo de Cabibbo, Kobayashi e Maskawa, em energias mais altas e com maior precisão no setor menos estudado dessa violação, os dos quarks pesados bottom e top, e ALICE iniciará seu programa científico quando o LHC substituir o feixe de prótons por feixes de núcleos pesados para estudar o plasma de quarks e glúons.

Quando estiver em operação dentro de seu programa científico de descoberta, o LHC trará informações sobre uma escala de tamanho da Natureza ainda completamente inexplorada, uma grande revolução na física de fato. Grande parte dos físicos teóricos de partículas esperam que novos fenônemos surjam na escala estudada pelo LHC por causa do problema da hierarquia da massa do bóson de Higgs.

Mais sobre essa notícia no site oficial do CERN.

150 Anos de Evolução

Sábado, 21 Nov 2009; Week 47 Leonardo Deixe um comentário
Em 24 de novembro de 2009, completar-se-á 150 anos da publicação de A Origem das Espécies, o trabalho seminal de Charles Darwin que descobriu a seleção natural. É um dia para celebrar uma das maiores conquistas da humanidade, que nos serve de base fundamental para compreender a estrutura dos seres vivos, a relação entre as diferentes espécies, e como novas espécies surgem. Em São Paulo capital, o Instituto de Biociências da USP realizará um evento de 23 a 27 de novembro. O jornal inglês The Guardian preparou um suplemento especial, e a National Science Foundation abriu um website. Em janeiro de 2010, ainda a tempo da comemoração, apresenta-se em cartaz internacional o filme de ficção Creation baseado na história de concepção do livro (ainda sem data certa para lançamento no Brasil). Para quem quiser conhecer a história real em detalhes, eu recomendo a leitura do fantástico livro As Aventuras e Descobertas de Darwin a Bordo do Beagle de Jorge Zahar Editor. Este livro foi escrito pelo tataraneto de Darwin, o fisiologista britânico Richard Darwin Keynes, pesquisador da Universidade de Cambridge. Usando como base o caderno de anotações pessoais de Darwin, o livro reconta em precisão, de forma acessível e também emocionante, a história — e de fato, grande aventura! — de Darwin como o naturalista da expedição do HMS Beagle e como ele, muito gradualmente, foi construindo sua concepção da teoria da evolução.

A semana nos arXivs…

Quinta-feira, 19 Nov 2009; Week 47 Daniel 2 comentários

Academia vs. Business

Academia vs. Business

Buzzwords

Buzzwords

O realejo do dia…

Terça-feira, 17 Nov 2009; Week 47 Daniel Deixe um comentário

Informação, entropia, geometria e teorias de campo médio.

Domingo, 15 Nov 2009; Week 46 Rafael S. Calsaverini 1 comentário

(eu perdi um sinal em algum lugar por aí, se você achar por favor indique no comentário)

Este post é uma espécie de continuação do post sobre Lógica Bayesiana, ainda que não exatamente. Mas estamos no mesmo espírito. Lá eu discuti a respeito de como raciocinar sobre informação incompleta. Entretanto, quando há informação incompleta uma coisa é certa: com o tempo podemos ganhar informação. E se há nova informação relevante para saber sobre algo, a probabilidade que atribuo – no sentido do post anterir, o registro quantitativo da minha crença racional sobre esse algo – deve certamente mudar.

A grande pergunta então parece ser: como eu devo mudar minha atribuição de probabilidades – minha crença racional – quando adquiro nova informação? Bem, isso sugere uma forma de quantificar informação: se informação causa mudança na minha atribuição de probabilidades, então se eu puder medir quão longe estão minhas atribuições prévia (prior, antes da nova informação) e posterior (posterior, depois da nova informação), então poderei medir quão importante é essa nova informação. Vamos fazer como antes então e propor uma medida de informação e vinculos que nos permitam restringi-la a uma medida única(1).

Leia mais…

Pompéo: triciclo elétrico brasileiro?

Sábado, 14 Nov 2009; Week 46 Leonardo 30 comentários

Parece que um grupo de engenheiros brasileiros deu início a um interessante projeto de construir e mercantilizar um triciclo elétrico, que mais parece um carro compacto de dois lugares. Eis o Pompéo:

De acordo com a reportagem original do Yahoo, Pompéu só existe por enquanto como desenho, O triciclo é projeto inicial dos engenheiros Renato César Pompeu da Universidade Tecnológica Federal do Paraná (UTFPR) e Carlos Eduardo Momblanch da Motta.Uma pergunta que tenho é: já foi construído um protótipo do motor com sucesso? Um protótipo do triciclo já está em parte construído com sucesso [veja o comentário do engenheiro Carlos E. M. da Motta]. A versão comercial do motor será construída pela empresa brasileira WEG. Segundo seus criadores, Pompéu chegaria até a 90 km/h e consumiria hoje cerca de 4 centavos da sua conta de eletricidade para rodar 1 km. Uma versão de motor a álcool também foi projetada, mas o que mais me interessou foi a versão elétrica. Além de ter potencial para uso empresarial como carro de prestação de serviços que não exigem transporte de carga pesada, o automóvel pode atrair consumidores que usam diariamente um carro para viagem até o trabalho. O triciclo ocuparia pouco espaço no trânsito e poluiria menos (ou nada). Mas eu vejo esse projeto como um embrião para o desenvolvimento de outros automóveis elétricos brasileiros para competir na nova indústria do Chevy Volt e do Tesla Roadster, que você talvez já tenha ouvido falar.

O Volt da Chevrolet está programado para entrar no mercado norte-americano no ano que vem. O carro é equipado com um motor elétrico que utiliza uma bateria para percorrer até aproximadamente 65 km sem recarga. Todavia, o carro é bivalente e o motor do Volt pode usar combustão quando a bateria acaba. Um parênteses: O projeto do Volt é um exemplo de como as empresas são desprovidas de ideologia que não seja ganhar muito dinheiro, pois o presidente atual da GM Chevrolet é um desses sujeitos que não acredita em aquecimento global e que acha que a poluição causada por humanos é irrelevante ao planeta, não obstante, ele pessoalmente através de entrevistas fez a promoção do Volt na mídia estadunidense.

Volt, apresentado pela GM, começa a ser vendido em 2010 nos EUA.

O Tesla Roadster já é vendido nos EUA a partir de $100 mil dólares, em um país onde o Honda Civic custa US$15 mil. Não sei qual o preço estimado do GM Volt, mas espero que não seja muito mais caro que um carro compacto da GM, que não sai por mais de US$ 15 mil. O Pompéu está previsto para vender no Brasil só a partir de 2012, por talvez cerca de R$30 mil — que hoje talvez seja um preço um pouco salgado para um triciclo simples. Você pode receber atualizações do projeto inscrevendo-se na lista de emails do site oficial.



Tesla Roadster

Para saber mais: leia o comentário do engenheiro Carlos Eduardo Momblanch da Motta, a quem agradeço muito as informações, e o site oficial do projeto:

http://www.triciclopompeo.com.br/

e também uma notícia no Yahoo.

Lógica Bayesiana

Sexta-Feira, 13 Nov 2009; Week 46 Rafael S. Calsaverini 1 comentário

Todo mundo conhece a lógica clássica, aquela segundo o qual proposições são julgadas verdadeiras ou falsas através de certos procedimentos de consistência. Mesmo que não conheça as regras da lógica formal, certamente já as usou e saberia reconhece-las. Poucos nunca ouviram o tal exemplo sobre a mortalidade ou não de Sócrates.  A lógica formal nos fornece uma forma de raciocínio: seguindo suas regras básicas eu consigo formas de, de posse de afirmações que eu julgo verdadeiras,  julgar a validade de outras. Mais ainda, na lógica não há espaço para ambiguidade e meia-certeza — o valor de uma proposição é verdadeiro ou falso, fim de papo. E note: ainda que eu não consiga determinar esse valor, está estabelecido desde o princípio que ele é verdadeiro ou falso.

Certamente isso fornece ferramentas úteis mas há uma grande limitação: como eu deveria raciocinar se eu não possuo informação completa sobre algo? A lógica formal não serve para isso. Eu não posso fazer perguntas como: “dado que eu acho a proposição P1 maaais ou menos certa, qual é o valor de P2?”. Há formas de lidar com essa questão de informação parcial? Isso é o que os probabilistas da escola bayesiana se perguntaram e o que eu pretendo dizer aqui é como responder positivamente essa pergunta.

A grande pergunta inicial é: como eu quantifico informação incompleta sobre algo? Em outras palavras, como eu digo a você quão fortemente eu acredito que algo é verdade? Uma vez determinada essa resposta a próxima pergunta é: como eu devo proceder, uma vez estabelecida o valor de uma proposição, para determinar o valor de outra proposição derivada dessa? Essas são as duas perguntas que eu vou tentar explicar como são respondidas pela teoria bayesiana.

Então para começo de conversa vamos estabelecer como se mede o grau de plausibilidade de algo (A. Caticha gosta de chamar de “degree of rational belief”, eu concordo com ele). Para cada proposição vamos criar uma função que associa a cada outra proposição um número real — a princípio irrestrito:

\Phi_{p} : \mathcal{P} \to \mathcal{R}, \forall p\in\mathcal{P}.

Aqui, \mathcal{P} é a coleção de proposições e \mathcal{R} o conjunto dos reais. Ao número \Phi_{P_1}(P_2) vamos chamar plausibilidade de P_2 no ambiente lógico (gerado por) P_1. Ou seja, esse número mede o quanto eu acredito em P_2 assumindo P_1 como “axioma”. Quanto maior o número maior minha crença.

Bem, não faz muito sentido apenas fazer isso. Preciso de algumas regras básicas para essa função. Essas regras devem me garantir que quando eu faço o “limite de certeza absoluta” eu recobre os resultados da lógica formal. Essas regras são chamadas axiomas de Cox e são bem simples e intuitivas. Melhor ainda: elas determinam \Phi_{p} quase univocamente (vamos entender esse quase adiante). Os axiomas de Cox são os seguintes:

A plausibilidade da negação de uma proposição é determinada assim que eu conheço a plausibilidade da própria proposição. Ou seja(2):

\Phi_{A}(\neg B) = F(\Phi_{A}(B)).

Parece razoável: quanto mais acredito em B, menos acredito em \neg B.  Note que há aqui a afirmação implícita de que a função que liga a plausibilidade de uma proposição com a plausibilidade da sua negação é única e independe de qual proposição estamos falando, nem do “ambiente lógico”.

A operação de negação é idempotente – ou seja, se eu aplicar a negação duas vezes, devo recuperar a proposição original(\neg \neg B = B). Essa propriedade nos fornece uma equação funcional para F(\cdot):

\Phi_{A}(\neg \neg B) = \Phi_{A}(B),

F(\Phi_{A}(\neg B)) = \Phi_{A}(B),

F(F(\Phi_{A}(B))) = \Phi_{A}(B).

Ou seja, para todos os valores u pertencentes à imagem de \Phi_{\cdot}(\cdot) devemos ter que:

F(F(u)) = u.

Ou seja, a função F(⋅) é idempotente também. Vamos reservar essa propriedade de F(\cdot) e prosseguir para o segundo axioma de Cox:

A plausibilidade da conjunção de duas proposições A\wedge B dada uma terceira proposição C (ou seja, \Phi_{C}(A \wedge B) ) deve depender apenas da plausibilidade de:

(1) plausibilidade de A dado C: \Phi_{C}(A);
(2) estabelecida a plausibilidade de A, quão plausível é B dado C : \Phi_{C\wedge A}(B).

Ou seja, estou assumindo a existência de mais uma “função universal”:

\Phi_{C}(A \wedge B) = G( \Phi_{C}(A) , \Phi_{C\wedge A}(B) ).

Também parece razoável: quando quero determinar se duas proposições são simultaneamente verdadeiras, estabeleço primeiro a validade da primeira e depois, dada a primeira, estabeleço a validade da segunda. É um pouco mais difícil tirar uma equação funcional para G(⋅ , ⋅) mas não é impossível. Considere a expressão:

\Phi_{B}(A_1 \wedge A_2 \wedge A_3).

Há duas formas diferentes de decompor essa expressão usando a função G(\cdot,\cdot): lembre-se que o conectivo \wedge é  associativo e comutativo e portanto:

\left(A_1 \wedge A_2\right) \wedge A_3 = A_1 \wedge \left(A_2 \wedge A_3\right).

Uma inferência consistente exige que essas duas formas dêem o mesmo resultado(3). Portanto:

G( \Phi_{B}(A_1 \wedge A_2) , \Phi_{B\wedge A_1 \wedge A_2}(A_3) ) = G(\Phi_{B}(A_1) , \Phi_{B\wedge A_1 }( A_2 \wedge A_3) ).

Aplicando novamente a definição de G(\cdot,\cdot):

G( G(\Phi_{B}(A_1),\Phi_{B \wedge A_1 }( A_2)) , \Phi_{B\wedge A_1 \wedge A_2}(A_3) ) = G(\Phi_{B}(A_1) , G(\Phi_{B\wedge A_1 }( A_2),\Phi_{B\wedge A_1 \wedge A_2 }( A_3)) ).

Se isso deve valer para quaisquer proposições então novamente tenho um equação funcional válida para quaiser u, v e w na imagem de \Phi_{\cdot}(\cdot)(4):

G(u,G(v,w)) = G(G(u,v),w).

Ou seja: a função G(⋅ , ⋅) também é associativa.

Um leitor apressado deve se perguntar nesse momento: e daí que você tem duas equações funcionais para essas funções arbitrárias F(⋅) e G(⋅ , ⋅) que você postulou do chapéu? O ponto é que essas duas equações funcionais generalíssimas definem univocamente estrutura de inferência! Sério mesmo. Não to brincando. E você conhece essa estrutura.

O coração da questão deriva de dois teoremas devidos a Cox. Para conseguir o primeiro teorema vamos usar o seguinte resultado (não vou provar aqui porque a prova é extensa e é encontrada na referência [2]).

Teorema da função associativa: dada qualquer função associativa G(u,v), existe uma função monotônica g(⋅) tal que:

g(G(u,v)) = g(u) g(v)

Isso é muito conveniente pois se escrevermos de novo a definição de G(\cdot,\cdot), temos:

\Phi_{C}(A \wedge B) = G( \Phi_{C}(A) , \Phi_{C\wedge A}(B) ),

e usarmos o teorema da função associativa, então obtemos:

g\left(\Phi_{C}(A \wedge B)\right) = g\left(\Phi_{C}(A)\right) g\left( \Phi_{C\wedge A}(B) )\right)

E agora posso simplesmente regraduar minha definição de plausibilidade. Uma vez que g() é monotônica, e portanto vai preservar a ordem com que eu classifico coisas como mais ou menos plausíveis, eu posso redefinir plausibilidade como:

\phi(A|B) = g(\Phi_{B}(A))

Mudei ligeiramente a notação para que o leitor possa apreciar melhor o que acontece com a antiga expressão que define G(⋅ , ⋅) com essa nova definição de plausibilidade:

\phi(A \wedge B | C) = \phi(B|C \wedge A) \phi(A|C)

Mas veja se essa não é a boa e velha regra do produto da teoria de probabilidades!!! Usando a comutatividade de \wedge eu ainda posso notar que:

\phi( B | C \wedge A) = \dfrac{\phi (A|C \wedge B) \phi (B|C)}{\phi (A|C)},

e essa não é nada mais que a regra de Bayes da teoria de probabilidades!

Mas calma, a nova função plausibilidade \phi(\cdot| \cdot) ainda não é uma probabilidade: não basta seguir essas duas regras, há uma série de condições na teoria axiomática de probabilidades para chamar algo com esse nome e a nossa função ainda não satisfaz todas. Tudo bem: ainda nos falta estudar as propriedades de F(\cdot)! Quem sabe isso ajude.

Novamente precisamos criar uma situação em que a demanda por consistência delimite as propriedades da função plausibilidade. Por exemplo temos a seguinte situação(5):

\phi(A \wedge B | C) = \phi(B|C \wedge A) \phi(A|C) =F\left(\phi(\neg B|C \wedge A)\right) \phi(A|C) .

Mas, pela regra do produto que deduzimos acima:

\phi(\neg B |C \wedge A) = \dfrac{\phi(A \wedge \neg B |C)}{\phi(A|C) }

e então:

\phi( A \wedge B | C) =\phi(A|C) F \left( \dfrac{\phi(A \wedge \neg B |C)}{\phi(A|C) }\right)

Mas lembre-se que a conjunção A \wedge B é simétrica, portanto toda essa expressão fica invariante se eu trocar A por B. E assim:

\phi(A|C) F \left( \dfrac{\phi(A \wedge \neg B |C)}{\phi(A|C) }\right)=\phi(B|C) F \left( \dfrac{\phi(B \wedge \neg A |C)}{\phi(B|C) }\right)

Se isso deve valer independente de quais são as proposições A, B e C, então eu posso, por exemplo, escolher uma particular proposição \neg B = A\wedge D. Note que com essa escolha temos as seguintes identidades: A\wedge \neg B = \neg B\neg A \wedge B = \neg A. Então:

\phi(A|C) F \left( \dfrac{\phi(\neg B |C)}{\phi(A|C) }\right)=\phi(B|C) F \left( \dfrac{\phi(\neg A |C)}{\phi(B|C) }\right)

\phi(A|C) F \left( \dfrac{F\left(\phi( B |C)\right)}{\phi(A|C) }\right)=\phi(B|C) F \left( \dfrac{F\left(\phi(A |C)\right)}{\phi(B|C) }\right)

O que finalmente resulta em mais uma equação funcional para F(⋅):

uF \left( \dfrac{F\left(v\right)}{u }\right)=v F \left( \dfrac{F\left(u\right)}{v }\right)

Novamente sem demonstrar, vou simplesmente afirmar que a solução mais geral dessa equação, submetida à condição de idempotência que deduzimos acima, é dada por:

F(u)^\alpha=(1-u^\alpha).

Note que para um \alpha qualquer isso restringe o dominio da função F(⋅), e portanto a imagem da função \phi(\cdot|\cdot), ao intervalo [0,1]. E veja o que acontece então com a regra que define F(⋅):

\phi(\neg A | B) ^\alpha + \phi(A|B)^\alpha = 1

Uma nova regraduação permite definir uma função Pr(A|B) =\phi(A|B)^\alpha com as seguintes propriedades:

  • Pr(A|B)\in[0,1]
  • Pr(A|B) + Pr(\neg A|B) = 1
  • Pr(A_1\wedge A_2|B) = Pr(A_2| B \wedge A_1)Pr(A_1 |B)

Esses não são exatamente os axiomas de Kolmogorov para a teoria de probabilidades mas… close enough para um post de blog. Isso tudo pode ser refinado com o devido grau de rigor matemático para satisfazer os exatos axiomas da teoria da probabilidade.

O que foi obtido com essa massagem matemática toda?

  1. É possível definir um sistema lógico de inferência baseado em informação incompleta e incerteza que atribui uma plausibilidade a cada proposição.
  2. Esse sistema lógico é único, a menos de uma regraduação monotônica da função plausibilidade. Isso faz com que uma ordenação segundo a plausibilidade seja única, uma vez que regraduações monotônicas não alteram essa ordem.
  3. A função plausibilidade satisfaz todas as regras que uma probabilidade legitima deve satisfazer (aqui não provei isso, mas apenas mostrei algumas coisas – para fazer isso rigorosamente precisa-se definir uma “sigma-álgebra de proposições”).

E qual é a utilidade prática disso? Bem… o mundo está cheio de situações de inferência baseada em informação incompleta. Particularmente, todo problema que depende de dados empíricos é, em essência, um problema dessa natureza e todo problema de inferência em ciência é assim. Uma vez que o único sistema de inferência para informação incompleta – como aí mostrado – é aquele que usa as regras  da teoria da probabilidade é razoável se supor que efetivamente usar essas regras explicitamente oferece vantagens sobre os métodos estatísticos ad hoc frequentemente usados, como os métodos de mínimos quadrados e outras formas de fitting de dados. Na verdade esse processo de inferência vai muito além disso – ele oferece ferramentas de modelagem física, de interpretação de modelos, de planejamento de experimentos e ainda mais. Mas disso eu vou tratar em um próximo post.

Notas:

(1) — Se você se interessa por nomes, o que se segue é devido a um certo número de pessoas — Edwin Jaynes, Harold Jeffreys e particularmente Richard Cox.

(2) — Estou usando os seguintes simbolos para os conectivos lógicos:

  • \neg — negação: \neg \mbox{Verdadeiro} = \mbox{Falso}
  • \wedge — o conectivo E (conjunção): \mbox{Verdadeiro} \wedge \mbox{Falso} = \mbox{Falso}
  • \vee — o conectivo OU (disjunção inclusiva): \mbox{Verdadeiro} \vee \mbox{Falso} = \mbox{Verdadeiro}

(3) — Lembre-se: queremos um sistema racional de atribuir um grau de confiança a algo.

(4) — Que pode ser obtida fazendo: u = \Phi_{B}(A_1), v = \Phi_{B \wedge A_1 }( A_2)) e w = \Phi_{B\wedge A_1 \wedge A_2 }( A_3).

(5) Note que eu tinha definido F(⋅) para a função original \Phi_{A}(B). Entretanto fizemos uma regraduação monotônica então nada me impede de abusar da linguagem e redefinir F(x) \to F(g(x)).

Referências:

[1] E. T. Jaynes, Probability Theory, the Logic of Science.
[2] A. Caticha, Lectures on Probability, Entropy, and Statistical Physics — arXiv:0808.0012v1 [physics.data-an]
[3] A. Caticha,  Quantifying Rational Belief — arXiv:0908.3212v1 [physics.data-an]

Contribuindo para o FQXi…

Quinta-feira, 12 Nov 2009; Week 46 Daniel Deixe um comentário

O FQXi, Foundational Questions Institute, tem como objetivo disseminar a pesquisa em áreas fundacionais da Física e da Cosmologia.

Em Agosto/09, eu fui convidado a integrar os blogueiros do FQXi :twisted: . E minha primeira participação acabou de ser posta online (sim, a coisa demorou pra acontecer porque existe todo um processo de editoração e revisão por pares :cool: ):

Na verdade, o artigo que eu escrevi ficou “grande demais”… então, ele foi dividido em 3 partes, e esse link é pra primeira parte, que foi ao ar ontem. As outras partes vão se seguir… mas eu ainda não sei quando serão postas online. De qualquer forma, fiquem ligados, eu ponho os links aqui conforme eles forem aparecendo. :wink:

Espero que vcs gostem… e, apesar de estar em Inglês, o Google Translate é seu amigo. :mrgreen:

Diversão garantida… ou sua Física de volta! :twisted: