Início > Ars Physica > Medidas em Física de Altas Energias e uma aplicação de estatística Bayesiana

Medidas em Física de Altas Energias e uma aplicação de estatística Bayesiana

quarta-feira, 10 fev 2010; \06\UTC\UTC\k 06 Deixe um comentário Go to comments

Sempre achei que esses títulos grandes dão uma certa importância ao texto que vem a seguir. E sempre achei que textos com primeira frase sobre o próprio estão enrolando porque não têm nada para dizer.

Bem, não é nenhum dos dois casos. Queria continuar falando sobre técnicas experimentais em física de altas energias. Essas que são feitas em grandes experimentos de aceleradores de partículas, como o LHC sobre o qual é tão falado na mídia. Como todo mundo sabe, o LHC é um colisor de prótons. É engraçado que, hoje em dia, mesmo pessoas que não sabem o que é um próton sabem que o LHC colide prótons. A idéia desses aceleradores é estudar interações entre prótons que tem seções de choque muito pequenas (ie, muito raras), que geram partículas muito massivas – possivelmente interações e partículas que não estejam de acordo com nossa compreensão atual do Modelo Padrão.

Essas novas partículas são vistas através de detectores de partículas que basicamente servem para ou medir o traço ou a energia dessas partículas (pergunta para o pessoal pensar: se em mecânica quântica não há o conceito de trajetória, como pode-se dizer que alguém mediu o traço de uma partícula?). Não vem muito ao caso agora como cada um desses detectores funciona. Não que não se saiba, a maioria dos processos físicos pelos quais eles funcionam são muito básicos, mas o importante é que o conjunto de detectores num experimento é complicado. Complicado o suficiente para não podermos escrever de forma analítica a relação seção de choque \to sinal no detector. Ok, então o que se faz?

Uma das coisas que se faz é tentar descrever cada pedaço desse detector individualmente, entendendo como cada tipo de partícula interage com o material que encontra no caminho. Isso certamente é possível e as pessoas fazem isso, mas o tempo de processamento computacional é, em geral, proibitivo. Uma outra razão pela qual isso nem sempre é aplicável é que não sabemos descrever alguns dos processos que geram as partículas, principalmente a parte não-perturbativa da QCD. Embora alguns métodos existam para estudar esse setor, como dualidades do tipo AdS/CFT, elas não dizem nada sobre o dito processo de hadronização nesse setor.

Vamos supor então que queremos identificar uma nova partícula. Por exemplo, a muitos anos atrás foi dado um prêmio Nobel à descoberta do bóson Z no CERN, no antigo colisor deles que se chamava LEP. Esse era um colisor de elétrons e pósitrons que podiam produzir um Z, pois tinham massa para isso. O que isso significa é que foi medido a produção de, entre outras coisas, um par de léptons que aprecem como sinais nesses detectores e a seção de choque tem uma estrutura de ressonânica típica de interações em teorias quânticas de campos que pode-se associar à existência de uma partícula. Eu já falei isso no meu último post e não quero falar de novo, só quero argumentar que em colisores de prótons (ou hádron de uma forma geral) isso é um pouco mais complicado. Para início de conversa não temos como saber exatamente a energia com que a colisão ocorreu. Mesmo que saibamos a energia do próton, o que colide são os quarks que o compõem, e eles tem uma certa distribuição de momento dentro do próton. Tudo que podemos fazer é medir a probabilidade de certo quark existir com certo momento (e calcular a evolução dessa quantidade usando Teoria Quântica de Campos).

Então, muitas vezes o que se faz é medir alguma outra variável que dependa dessa quantidade que está sendo medida. Por exemplo, vamos dizer que estamos tentando medir a massa de uma nova partícula que decai em um elétron e outra coisa. Podemos medir o momento desses elétrons e nos perguntar qual é a massa mais provável dessa partícula dado as hipóteses da nossa teoria e dos dados observados. Isso é o que as pessoas chamam medida por template fitting em estatística. Claro que determinar esses templates sempre vai conter incertezas que devem ser levadas em conta, mas que não queremos que seja o fator limitante na nossa medida. Afinal, esse é apenas um artifício de conta, não há física envolvida aí. Em termos simples, o que precisamos fazer então é simular muitos eventos para diminuir essa incerteza. Como disse acima, simular cada pedacinho do detector é demorado e está fora de questão para o nível de precisão que se busca em física de altas energias.

O que se faz então é parametrizar a resposta do experimento com um número mínimo de variáveis mas que ainda descreva bem as distribuições em termos da quantidade que queremos medir. Essa parametrização, num leve abuso de nome, é chamado de Fast Monte Carlo. Nessa parametrização vai entrar inclusive aquela parte de eventos físicos que nem temos uma teoria para descrever (então, no melhor estilo Bayesiano, não faz nem muito sentido calcular probabilidades para ela), isso porque esses sinais tem que ser separados dos eventos que queremos medir.

Existe uma razão mais física para descrever muito bem esse “lixo” do produto da colisão. Muitas partículas não são vistas diretamente no detector, seja porque sua interação é negligível como é o caso do neutrino, seja o caso de haver leis de conservações extras, como é o caso de SUSY (simetria R), dimensões extras (alguma simetria vinda de transformações discretas das dimensões extras) ou qualquer outra teoria além do modelo padrão. Então, separar o “lixo” do evento das coisas que não vemos é importante se quisermos realmente medir algo novo (que, por hipótese, sabemos descrever)

Em geral, se usa dados medidos para parametrizar esses eventos que não interessam. Muitas coisas entram nesse “lixo”: colisões secundárias, remanescentes dos próton (coisas que vêm dos outros quarks que não colidiram) ou outras partículas que foram produzidas juntamente com a partícula que queremos medir no evento principal. As duas primeiras são razoavelmente simples de se medir, basta se lembrar que nossos eventos são incrivelmente mais raros do que qualquer outra dessas coisas (algumas dezenas de pb contra centenas de mb!!!), então na ausência de qualquer seleção de eventos, tudo que temos é uma imensa biblioteca desses dados.

Quanto ao resto do evento produzido na mesma interação que deu origem à partícula do campo que quermos medir, a coisa é mais complicada. Nesse caso temos que ser mais espertos. Uma idéia é fazer a biblioteca de dados usando alguma interação similar que podemos traduzir na de nosso interesse. Por exemplo, os eventos de Z que discuti acima podem ser usados para dizer algo sobre W. Nesse caso, o resto do evento poderia ser o recuo hadrônico dos quarks produzidos junto ao W.

Muito bom, mas como traduzir um certo W com dado quadrimomento para um recuo medido. Aí que a estatística Bayesiana pode nos ajudar. A aplicação é simples, mas ainda assim poderosa. O que queremos fazer é o que se conhece em estatística como unfolding de uma distribuição. Basicamente queremos saber qual vai ser o recuo no estado final F dado um certo W produzido no estado inicial I. Temos a distribuição de estados finais n(F) medida e um modelo para P(F|I). O que queremos determinar é P(I|F). O teorema de Bayes nos diz que:

P(I|F) = \frac{P(F|I)P(I)}{\sum_F P(F|I)P(I)}

o fator no denominador não é importante, é apenas uma normalização que diz que toda partícula no estado final veio de alguma interação do estado inicial, não acho que causalidade esteja em questão aqui e não estamos levando em consideração sinais falsos separadamente. A dificuldade, como sempre em estatística Bayesiana, é determinar o prior P(I). Não há uma maneira de se determiná-lo diretamente, mas há um processo iterativo que funciona em muitos casos. A idéia é pegar um prior qualquer P_0(I) (uniforme, por exemplo), usar o teorema de Bayes e daí os dados medidos para calcular um novo prior P_1(I)=\sum_F n(F)P(I|F). Nos casos que eu já fiz, esse procedimento costuma convergir bem rápido e nos possibilita então descrever a parte do evento que não nos interessa muito bem para podermos então nos concentrar na parte que interessa para nossa teoria.

Bem legal, não? Bem, depois de dois posts sobre física experimental, na próxima vez eu juro que volto a falar de física teórica.

Categorias:Ars Physica
  1. Nenhum comentário ainda.
  1. No trackbacks yet.

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: