Arquivo

Archive for the ‘Mathematics’ Category

As Raízes da Metafísica…

segunda-feira, 22 ago 2011; \34\America/New_York\America/New_York\k 34 1 comentário

Acabei de ler o post The Roots of Metaphysics que trata do Paradoxo de Russell — que tem a mesma natureza do Argumento Diagonal (o fato de que os Reais são incontáveis).

Entretanto, no sentido exposto no texto — “(…) no set of existential statements can entail a universal statement” —, a primeira coisa que veio a minha mente foi o Teorema do Limite Central (e suas “variações sobre o tema”). Ou seja, apesar dos pesares, minha crítica ao texto, ao modo como o problema foi exposto no texto, é que eu não achei que a noção de recursividade ficou exposta de modo claro o suficiente (de modo que se note que ela é o ‘pilar’ por detrás do problema sendo tratado). A analogia feita no texto é a de que enquanto a afirmação “todos os morcegos estão na pia” é universal, a afirmação “há um morcego na pia” é existencial. O problema dessa analogia é que nós já sabemos, a priori, que o número de morcegos é finito (assumindo, claro, que só existem morcegos no nosso planeta), o que faz uma diferença enorme em toda essa brincadeira. Num certo sentido, o problema dessa analogia está no Paradoxo de Banach–Tarski: se fosse possível, através dum corte ao meio, se obter dois morcegos idênticos entre si, a partir dum morcego original, aí sim, essa seria uma analogia bona fide, uma vez que a recursividade estaria então implementada no problema. Aliás, é por essas, e outras, que existem diferentes formulações da Teoria de Conjuntos, como, e.g., Teoria de Conjuntos de Zermelo–Fraenkel (e suas respectivas objeções), assim como Teoria de Topos e Teoria de Conjuntos de Tarski–Grothendieck.

Acho interessante ver que o Paradoxo de Russell é de ~1925… e que, por exemplo, os Teoremas de Incompletude de Gödel são de 1931: quando postos em contexto, acho que as implicações são bem interessantes. :wicked:

No final das contas, esse assunto tem um nome: Meta-Matemática — leia mais sobre isso em Meta Math! The Quest for Omega e Omega and why maths has no TOEs. Ou seja, como devemos usar a matemática pra avaliar a própria matemática?

Num certo sentido, isso me leva a pensar diretamente sobre o conceito de Grupo de Renormalização, Teorias Efetivas e Espaço de Teorias (em física teórica) (ver também Grupo de Renormalização Funcional). Ou seja, em Física existem teorias que são fundamentalmente desconexas (como, por exemplo, a Relatividade Geral e a Mecânica Quântica); entretanto, existe todo um outro conjunto de teorias que estão conectadas via o Grupo de Renormalização: ou seja, existe uma teoria pra explicar cada conjunto de graus-de-liberdade (ie, as variáveis que descrevem uma determinada teoria); entretanto, é possível se rearranjar um conjunto de graus-de-liberdade de modo a se obter as variáveis relevantes para se explicar outra teoria — esse fenômeno leva o nome de Transição de Fase.

Nesse sentido, existem várias escalas relevantes para a Física, que efetivamente formam “ilhas de teorias”, ou “ilhas de verdade” (à la Gödel). Dessa forma, acabamos com um sistema multi-fractal: a auto-similaridade consiste no fato de que toda a estrutura Física se repete nas diversas escalas: Lagrangianos, [quantização via] Integral de Trajetória de Feynman, Renormalização, etc, etc, etc — exceto, claro, por pontos-fixos não-triviais no Fluxo de Renormalização. 😉

O Lamento dum Matemático…

domingo, 21 ago 2011; \33\America/New_York\America/New_York\k 33 1 comentário

Acabei de encontrar esse artigo (PDF), escrito por Keith Devlin, onde a seguinte citação aparece:

“… The first thing to understand is that mathematics is an art. The difference between math and the other arts, such as music and painting, is that our culture does not recognize it as such. Everyone understands that poets, painters, and musicians create works of art, and are expressing themselves in word, image, and sound. In fact, our society is rather generous when it comes to creative expression; architects, chefs, and even television directors are considered to be working artists. So why not mathematicians?”

(Tradução livre: “… A primeira coisa a entender é que a matemática é uma arte. A diferença entre a matemática e as outras artes, como música e pintura, é que nossa cultura não a reconhece [como arte]. Todo mundo entende que poetas, pintores, e músicos criam trabalhos de arte, e se expressam em palavras, imagens e sons. De fato, nossa sociedade é meio generosa quando o assunto é expressão criativa; arquitetos, chefs [de cozinha], e até mesmo diretores de TV são considerados artistas. Então, por que não os matemáticos?”)

Taí uma desses “perguntinhas capiciosas” que têm a capacidade de mudar muita coisa… “Por que não os matemáticos?”

Robust Discretization Schemes…

quarta-feira, 26 jan 2011; \04\America/New_York\America/New_York\k 04 3 comentários

ResearchBlogging.org

Today, the following article came up on the arXivs:

This is all fine and dandy… but my question is: “How does this paper (above) compare to the following”:

That is, GR is naturally written in terms of [pseudo-]differential forms (aka tensor densities), so the methods described above should be very appropriate to attack the problem of discretizing the path integral in such a way as to retain its symmetries.

» Robert Oeckl (2005). DISCRETE GAUGE THEORY: From Lattices to TQFT World Scientific eBooks, 1-216 DOI: 10.1142/9781860947377

Miami 2010…

domingo, 12 dez 2010; \49\America/New_York\America/New_York\k 49 1 comentário

This week I will be at the Miami 2010, so I will try and “live tweet” the conference, with some comments and pictures — the hashtag will be #miami2010.

If anyone is interested, here’s the talk I am giving on tuesday (2010-Dec-14, right after lunch 😉 ),

😈

Updated (2010-Dec-15): Here are the notes to my talk, mostly of stuff that was said and is not in the PDF above,

Neurociência e o Projeto Ersätz-Brain…

quarta-feira, 8 dez 2010; \49\America/New_York\America/New_York\k 49 Deixe um comentário

ResearchBlogging.org

Bom pessoal, como anunciado anteriormente, vamos falar um pouco sobre um certo aspecto da Neurociência: o da modelagem de redes neurais via sistemas dinâmicos, modelo de Potts e, por que não, teorias de gauge (cf. What is a gauge?, Gauge theories (scholarpedia), Preparation for Gauge Theory e Gauge Theory (José Figueroa-O’Farrill)).

O nome-do-jogo, aqui, é Projeto Ersätz-Brain, e a idéia é a de se construir uma “arquitetura” análoga a de um cérebro para aplicações cognitivas. A base dessa arquitetura são as estruturas de audição e de visão do cérebro: ao contrário do que ingenuamente se imagina, ambas essas estruturas são altamente hierarquizadas e distribuídas. Ou seja, grupos diferentes (e espacialmente distribuídos) de neurônios lidam com ‘pedaços’ diferentes da informação sendo recebida, enquanto que um outro grupo de neurônios “integra” essas informações, numa camada hierárquica superior as anteriores.

Então, a motivação é a de se construir uma arquitetura distribuída e hierárquica — ou, no jargão que nós usamos, uma “rede [neural] de redes [neurais]”: ou seja, estamos dando um passo na direção da “recursividade” da arquitetura usual de redes neurais. Alguns chamariam tal passo de meta redes neurais” e outros de rede neurall Gödeliana, ambos os nomes aludindo à natureza auto-referencial da arquitetura: “redes de redes”.

Pra dar um exemplo concreto dum problema que estamos atacando atualmente, vamos pensar em termos do Código Morse: imagine que o nosso EB é como uma criança que ainda não aprendeu a falar e se pergunte: “Como é que uma criança aprende um idioma?” Agora vamos fazer de conta que o idioma não é uma das línguas faladas ao redor do globo, mas sim Código Morse… e, ao invés de termos uma criança, temos uma arquitetura de redes neurais, um EB. 😉

O que a gente pretende fazer é colocar um sinal de código Morse como dado de entrada para o EB e, do outro lado dessa “caixa preta”, tirar a mensagem descodificada. O EB tem que aprender código Morse e identificá-lo com os símbolos usuais do alfabeto, pra assim poder dar como saída a mensagem apropriada.

Quem está acostumado com o paradigma usual de redes neurais e Teoria de Hebb já deve ter percebido que esse tipo de approach não vai funcionar no caso do EB. A pergunta, então, se põe sozinha: “E agora, José?” 😉

O insight é não pensar em termos de “memória”, mas sim em termos de “dinâmica de informação”. Ou seja, ao invés de tentarmos ficar memorizando padrões em cima de padrões, pra depois associar a outros padrões, e assim por diante… a idéia é se notar que, assim como em Teorias de Gauge, há muita informação repetida e muito ruído nesse problema. Então, se Teorias de Gauge funcionam tão bem na Física… por que não tentar implementar um pouco delas em Redes Neurais?! 😈

É exatamente isso que estamos fazendo atualmente, criando um modelo para o EB em termos de Teorias de Gauge. Ou seja, há dois tipos de “dinâmicas” em jogo, uma “interna” e outra “externa” (por falta de nomes melhores). A “interna” é como a simetria de gauge em Física, e fornece a dinâmica dos graus-de-liberdade das partículas de gauge, enquanto que a “externa” é a dinâmica dos campos propriamente ditos. Dessa forma a gente estabelece dum modo bem claro uma relação de ‘recursividade’: a dinâmica “interna” determina o estado “externo” e vice-versa (num sistema de feedback).

Então, a gente pode pensar num Modelo de Potts com 3 estados: ponto, espaço, e ‘espaço branco’ (entre palavras). Esses 3 estados estão sujeitos a uma certa “dinâmica interna” — à la BSB, cf. Learning and Forgetting in Generalized Brain-State-in-a-Box (BSB) Neural Associative Memories — que é descrita por um sistema dinâmico (BSB), e o resultado dessa dinâmica “interna” seleciona um determinado estado para a dinâmica “externa”, que é guiada, por exemplo, por uma dinâmica do tipo BSB também (mas pode ser algum outro tipo, isso não é muito relevante no momento).

Pra apimentar ainda mais esse paradigma, nós estamos implementando ‘operadores de nós’ (knot operators), que são estados topológicos e robustos perante uma gama de “perturbações” do EB. Como esses estados são robustos, é fácil transportá-los hierarquicamente, de um nível hierárquico para outro. O que leva a algumas especulações bastante não-triviais sobre o “aprendizado” do EB — ao contrário do que é normalmente feito em “Teoria Habbiana”.

Bom, por enquanto é só… quem quiser ler um pouco mais sobre o trabalho, pode dar uma olhada num artigo (um pouco antigo, é verdade — o novo vai sair quando eu acabar de escrever 😉 ) disponível no livro abaixo:

Żak, S., Lillo, W., & Hui, S. (1996). Learning and Forgetting in Generalized Brain-state-in-a-box (BSB) Neural Associative Memories Neural Networks, 9 (5), 845-854 DOI: 10.1016/0893-6080(95)00101-8

SciBloWriMo…

segunda-feira, 8 nov 2010; \45\America/New_York\America/New_York\k 45 1 comentário

O mês de Novembro é conhecido no meio literário como NaNoWriMo, National Novel Writing Month.

Um pessoal da Matemática decidiu pegar carona nessa idéia de criar o MaBlogWriMo: Math Blog Writing Month. A idéia, como descrita no link, é a de se escrever todo dia um post com até 1.000 palavras sobre matemática. 😎

Então, parafraseando ambos esses eventos, vou começar o SciBloWriMo: Science Blog Writing Month! 😈

Eu vou aproveitar que vou dar uma palestra na conferência Miami 2010 e pegar uma carona pra falar dum tema que eu já venho trabalhando há algum tempo: o espaço de soluções (aka moduli space) de teorias quânticas de campo e suas simetrias. Esse será um dos temas do SciBloWriMo aqui no AP.

O outro tema é o de um trabalho que eu venho realizando atualmente, em colaboração com um pessoal da Neurociência, sobre o funcionamento hierárquico e maçissamente paralelo do cérebro, chamado Ersätz-Brain.

Assim que os posts forem ficando prontos, eu os linko aqui,

  • Álgebra, Teoria da Representação e Picard-Lefschetz;
  • Neurociência e o Projeto Ersätz-Brain: Teoria de Gauge, Variáveis de Nós e o Funcionamento Hierárquico do Cérebro.

É isso aí: espero que ninguém esteja com medo do frio! 😉

Simetria e Dualidade em Matemática e Física…

quarta-feira, 23 jun 2010; \25\America/New_York\America/New_York\k 25 Deixe um comentário

Cálculo Exterior para Elementos Finitos…

sábado, 6 mar 2010; \09\America/New_York\America/New_York\k 09 Deixe um comentário

ResearchBlogging.org

O artigo Finite element exterior calculus: from Hodge theory to numerical stability trata dum tópico que eu gosto muito: análise numérica feita com ferramentas modernas (e.g., Cohomologia de de Rham e Teoria de Hodge).

Meu interesse sobre esse tipo de tópico começou cedo, quando na graduação eu comecei a lidar com problemas numéricos. A noção de que a estabilidade e convergência do método numérico deveria variar com a particular discretização (“mesh”) escolhida sempre ficou atrás da minha orelha. Mas, naquelas épocas, ainda estando na graduação, pouco era possível se fazer. Mas a vontade de aplicar essas idéias em Lattice Gauge Theory sempre me provocou. 😉

Um pouco mais tarde, já na pós (mestrado), eu trombei com alguns artigos interessantes que, novamente, morderam essa mesma pulguinha,

Meu interesse por esses artigos era claro: o esquema de discretização deles tenta preservar as simetrias de Lie do problema original. Isso é particularmente importante se o objetivo é simular problemas que envolvem Quebra de Simetria! 💡 😎

Um pouco de tempo depois… me aparece o seguinte artigo, A Discrete Exterior Calculus and Electromagnetic Theory on a Lattice; que, mais tarde, seria seguido pelos seguintes artigos: Discrete Differential Geometry on Causal Graphs e Differential Geometry in Computational Electromagnetics.

A idéia, então, era novamente clara: aplicar esse mecanismo de Cálculo Exterior Discreto em Teorias de Gauge! 💡 😎

Afinal de contas, quem sabe, não daria pra juntar ambas as idéias: usar Cálculo Exterior Discreto de forma a preservar as simetrias [de Lie] do problema no contínuo ❗ O que será que poderia sair daí?! (De fato, não tenho a menor noção, infelizmente nunca tive tempo de voltar e morder essa questão. Mas, taí um problema prum doutorado… 😉 )

Bom, depois de tudo isso, aparece o artigo que motivou esse post — eu tinha que falar alguma coisa a respeito dele.

Na verdade, esse artigo vai mais longe, extendendo o trabalho feito anteriormente, definindo apropriadamente uma Teoria de Hodge para Elementos Finitos, e avaliando as conseqüências para a consistência (“well-posedness of the Cauchy problem”; algo que varia muito com as particularidades da questão em mãos) e estabilidade numérica do problema. Portanto, as técnicas disponíveis agora são muito mais robustas! (O que só me deixa cada vez mais curioso pra saber a resposta das questões acima… 😉 )

É isso aí: a leitura é excelente, a diversão é garantida… e eu não me responsabilizo por noites de sono perdidas (por causa das questões acima)! 😈

Referências

  • Arnold, D., Falk, R., & Winther, R. (2010). Finite element exterior calculus: from Hodge theory to numerical stability Bulletin of the American Mathematical Society, 47 (2), 281-354 DOI: 10.1090/S0273-0979-10-01278-4

Seminário de Física-Matemática de Königsberg…

sábado, 6 mar 2010; \09\America/New_York\America/New_York\k 09 2 comentários

ResearchBlogging.org

Königsberg é uma cidade na Alemanha famosa por suas sete pontes. Mas, há outra razão também: 150 anos depois dessas pontes inspirarem Euler, nos idos de 1880, a Universidade de Königsberg possuia um seminário de Física-Matemática, que ajudou a formar a carreira científica de David Hilbert e de Hermann Minkowski.

O simples fato de que esse tipo de seminário existia naqueles tempos é um tributo às reformas (Era Prussiana) no sistema educacional alemão: essas reformas começaram com as idéias de Martinho Lutero, que desejava que todas as pessoas devessem ser educadas para poderem ler e interpretar a Bíblia por si sós, independentemente. Foi esse conceito de educação obrigatória que se tornou o ideal educacional alemão da época.

No século 18, o então “Reino da Prússia” foi um dos primeiros países do mundo ( ❗ ) a introduzir educação gratuita e obrigatória. Por volta de 1810, depois das “Guerras Napoleônicas“, a Prússia introduziu o conceito de “certificações estaduais” para professores, o que levantou significativamente o nível da educação naquele país.

O Seminário de Física-Matemática nasceu com Franz Neumann e Carl Jacobi — eles foram patrocinados por Friedrich Wilhelm Bessel, astrônomo e diretor do observatório. Esse foi o primeiro seminário oficial da Prússia a incorporar métodos matemáticos no ensino de Física — um passo com muitas conseqüências: a universidade se tornou o centro duma escola de física-matemática, o que moldou a formação dessa disciplina de modo substancial!

Eis algumas outras conseqüências desse Seminário:

  1. Os atendentes dos seminários, jovens pesquisadores, transferiram as idéias educacionais básicas pra outras universidades, onde elas eram adaptadas e desenvolvidas. Isso é muito análogo ao conceito moderno de pós-doutorado, onde o recém-doutor deixa sua instituição e vai exercer seu primeiro emprego, como pós-doutor, em outra instituição, levando consigo os ensinamentos e idéias adquiridas em sua alma matter;
  2. No contexto científico da Física e da Matemática, o Seminário influenciou fortemente o desenvolvimento de áreas de pesquisa e metodologias; &
  3. Devido a responsabilidade pedagógica e esforço pessoal de Franz Neumann, por mais de 4 décadas, o Seminário tem que ser visto como o começo duma nova disciplina, que pode ser chamada de Física Teórica (ou Física Matemática).

Ainda mais importante que o Seminário, foi o Colóquio semanal, em matemática, estabelecido por Lindemann (em 1884). O Colóquio oferecia um fórum para palestras e diálogos científicos no nível de pesquisa (ao contrário do Seminário, cujo objetivo era mais pedagógico, no sentido de ensinar os tópicos expostos) ❗

Para mais detalhes e maiores diversões… o artigo abaixo é muito gostoso de se ler. 😈

Referências

  • Schwermer, J. (2010). Minkowski in Königsberg 1884: A talk in Lindemann’s colloquium Bulletin of the American Mathematical Society, 47 (2), 355-362 DOI: 10.1090/S0273-0979-10-01291-7

Winter Workshop on Non-Perturbative QFT…

segunda-feira, 18 jan 2010; \03\America/New_York\America/New_York\k 03 Deixe um comentário

I’m live tweeting the Winter Workshop in Non-Perturbative QFT. The tweets are being tagged with #wwnpqft and can all be found at,

Have fun! 😈

Non-Perturbative QFT…

domingo, 17 jan 2010; \02\America/New_York\America/New_York\k 02 3 comentários

O Instituto Não-Linear de Nice vai realizar um Workshop de Inverno sobre QFT não-perturbativa — e eu fui convidado a dar uma palestra. 😈

O Workshop começa amanhã e eu já estou no gás todo (apesar da horrível viagem de SP pra Paris)! 😉

Quem se interessar, minha palestra pode ser vista no seguinte link,

Se for possível, eu vou tentar fazer ou um live blogging (aqui no AP) ou um live tweeting (no meu twitter): não prometo nada mas, fiquem de olho… quem sabe não dá certo?! 😉

A semana nos arXivs…

quinta-feira, 10 dez 2009; \50\America/New_York\America/New_York\k 50 Deixe um comentário


Transcendental Meditation

Transcendental Meditation

Realejo do dia…

terça-feira, 8 dez 2009; \50\America/New_York\America/New_York\k 50 Deixe um comentário

y = exp(x)

y = exp(x)

A semana nos arXivs…

quarta-feira, 2 dez 2009; \49\America/New_York\America/New_York\k 49 Deixe um comentário


A semana nos arXivs…

quinta-feira, 19 nov 2009; \47\America/New_York\America/New_York\k 47 2 comentários


Academia vs. Business

Academia vs. Business

Buzzwords

Buzzwords

Informação, entropia, geometria e teorias de campo médio.

domingo, 15 nov 2009; \46\America/New_York\America/New_York\k 46 1 comentário

(eu perdi um sinal em algum lugar por aí, se você achar por favor indique no comentário)

Este post é uma espécie de continuação do post sobre Lógica Bayesiana, ainda que não exatamente. Mas estamos no mesmo espírito. Lá eu discuti a respeito de como raciocinar sobre informação incompleta. Entretanto, quando há informação incompleta uma coisa é certa: com o tempo podemos ganhar informação. E se há nova informação relevante para saber sobre algo, a probabilidade que atribuo – no sentido do post anterir, o registro quantitativo da minha crença racional sobre esse algo – deve certamente mudar.

A grande pergunta então parece ser: como eu devo mudar minha atribuição de probabilidades – minha crença racional – quando adquiro nova informação? Bem, isso sugere uma forma de quantificar informação: se informação causa mudança na minha atribuição de probabilidades, então se eu puder medir quão longe estão minhas atribuições prévia (prior, antes da nova informação) e posterior (posterior, depois da nova informação), então poderei medir quão importante é essa nova informação. Vamos fazer como antes então e propor uma medida de informação e vinculos que nos permitam restringi-la a uma medida única(1).

Leia mais…

Lógica Bayesiana

sexta-feira, 13 nov 2009; \46\America/New_York\America/New_York\k 46 6 comentários

Todo mundo conhece a lógica clássica, aquela segundo o qual proposições são julgadas verdadeiras ou falsas através de certos procedimentos de consistência. Mesmo que não conheça as regras da lógica formal, certamente já as usou e saberia reconhece-las. Poucos nunca ouviram o tal exemplo sobre a mortalidade ou não de Sócrates.  A lógica formal nos fornece uma forma de raciocínio: seguindo suas regras básicas eu consigo formas de, de posse de afirmações que eu julgo verdadeiras,  julgar a validade de outras. Mais ainda, na lógica não há espaço para ambiguidade e meia-certeza — o valor de uma proposição é verdadeiro ou falso, fim de papo. E note: ainda que eu não consiga determinar esse valor, está estabelecido desde o princípio que ele é verdadeiro ou falso.

Certamente isso fornece ferramentas úteis mas há uma grande limitação: como eu deveria raciocinar se eu não possuo informação completa sobre algo? A lógica formal não serve para isso. Eu não posso fazer perguntas como: “dado que eu acho a proposição P1 maaais ou menos certa, qual é o valor de P2?”. Há formas de lidar com essa questão de informação parcial? Isso é o que os probabilistas da escola bayesiana se perguntaram e o que eu pretendo dizer aqui é como responder positivamente essa pergunta.

A grande pergunta inicial é: como eu quantifico informação incompleta sobre algo? Em outras palavras, como eu digo a você quão fortemente eu acredito que algo é verdade? Uma vez determinada essa resposta a próxima pergunta é: como eu devo proceder, uma vez estabelecida o valor de uma proposição, para determinar o valor de outra proposição derivada dessa? Essas são as duas perguntas que eu vou tentar explicar como são respondidas pela teoria bayesiana.

Então para começo de conversa vamos estabelecer como se mede o grau de plausibilidade de algo (A. Caticha gosta de chamar de “degree of rational belief”, eu concordo com ele). Para cada proposição vamos criar uma função que associa a cada outra proposição um número real — a princípio irrestrito:

\Phi_{p} : \mathcal{P} \to \mathcal{R}, \forall p\in\mathcal{P}.

Aqui, \mathcal{P} é a coleção de proposições e \mathcal{R} o conjunto dos reais. Ao número \Phi_{P_1}(P_2) vamos chamar plausibilidade de P_2 no ambiente lógico (gerado por) P_1. Ou seja, esse número mede o quanto eu acredito em P_2 assumindo P_1 como “axioma”. Quanto maior o número maior minha crença.

Bem, não faz muito sentido apenas fazer isso. Preciso de algumas regras básicas para essa função. Essas regras devem me garantir que quando eu faço o “limite de certeza absoluta” eu recobre os resultados da lógica formal. Essas regras são chamadas axiomas de Cox e são bem simples e intuitivas. Melhor ainda: elas determinam \Phi_{p} quase univocamente (vamos entender esse quase adiante). Os axiomas de Cox são os seguintes:

A plausibilidade da negação de uma proposição é determinada assim que eu conheço a plausibilidade da própria proposição. Ou seja(2):

\Phi_{A}(\neg B) = F(\Phi_{A}(B)).

Parece razoável: quanto mais acredito em B, menos acredito em \neg B.  Note que há aqui a afirmação implícita de que a função que liga a plausibilidade de uma proposição com a plausibilidade da sua negação é única e independe de qual proposição estamos falando, nem do “ambiente lógico”.

A operação de negação é idempotente – ou seja, se eu aplicar a negação duas vezes, devo recuperar a proposição original(\neg \neg B = B). Essa propriedade nos fornece uma equação funcional para F(\cdot):

\Phi_{A}(\neg \neg B) = \Phi_{A}(B),

F(\Phi_{A}(\neg B)) = \Phi_{A}(B),

F(F(\Phi_{A}(B))) = \Phi_{A}(B).

Ou seja, para todos os valores u pertencentes à imagem de \Phi_{\cdot}(\cdot) devemos ter que:

F(F(u)) = u.

Ou seja, a função F(⋅) é idempotente também. Vamos reservar essa propriedade de F(\cdot) e prosseguir para o segundo axioma de Cox:

A plausibilidade da conjunção de duas proposições A\wedge B dada uma terceira proposição C (ou seja, \Phi_{C}(A \wedge B) ) deve depender apenas da plausibilidade de:

(1) plausibilidade de A dado C: \Phi_{C}(A);
(2) estabelecida a plausibilidade de A, quão plausível é B dado C : \Phi_{C\wedge A}(B).

Ou seja, estou assumindo a existência de mais uma “função universal”:

\Phi_{C}(A \wedge B) = G( \Phi_{C}(A) , \Phi_{C\wedge A}(B) ).

Também parece razoável: quando quero determinar se duas proposições são simultaneamente verdadeiras, estabeleço primeiro a validade da primeira e depois, dada a primeira, estabeleço a validade da segunda. É um pouco mais difícil tirar uma equação funcional para G(⋅ , ⋅) mas não é impossível. Considere a expressão:

\Phi_{B}(A_1 \wedge A_2 \wedge A_3).

Há duas formas diferentes de decompor essa expressão usando a função G(\cdot,\cdot): lembre-se que o conectivo \wedge é  associativo e comutativo e portanto:

\left(A_1 \wedge A_2\right) \wedge A_3 = A_1 \wedge \left(A_2 \wedge A_3\right).

Uma inferência consistente exige que essas duas formas dêem o mesmo resultado(3). Portanto:

G( \Phi_{B}(A_1 \wedge A_2) , \Phi_{B\wedge A_1 \wedge A_2}(A_3) ) = G(\Phi_{B}(A_1) , \Phi_{B\wedge A_1 }( A_2 \wedge A_3) ).

Aplicando novamente a definição de G(\cdot,\cdot):

G( G(\Phi_{B}(A_1),\Phi_{B \wedge A_1 }( A_2)) , \Phi_{B\wedge A_1 \wedge A_2}(A_3) ) = G(\Phi_{B}(A_1) , G(\Phi_{B\wedge A_1 }( A_2),\Phi_{B\wedge A_1 \wedge A_2 }( A_3)) ).

Se isso deve valer para quaisquer proposições então novamente tenho um equação funcional válida para quaiser u, v e w na imagem de \Phi_{\cdot}(\cdot)(4):

G(u,G(v,w)) = G(G(u,v),w).

Ou seja: a função G(⋅ , ⋅) também é associativa.

Um leitor apressado deve se perguntar nesse momento: e daí que você tem duas equações funcionais para essas funções arbitrárias F(⋅) e G(⋅ , ⋅) que você postulou do chapéu? O ponto é que essas duas equações funcionais generalíssimas definem univocamente estrutura de inferência! Sério mesmo. Não to brincando. E você conhece essa estrutura.

O coração da questão deriva de dois teoremas devidos a Cox. Para conseguir o primeiro teorema vamos usar o seguinte resultado (não vou provar aqui porque a prova é extensa e é encontrada na referência [2]).

Teorema da função associativa: dada qualquer função associativa G(u,v), existe uma função monotônica g(⋅) tal que:

g(G(u,v)) = g(u) g(v)

Isso é muito conveniente pois se escrevermos de novo a definição de G(\cdot,\cdot), temos:

\Phi_{C}(A \wedge B) = G( \Phi_{C}(A) , \Phi_{C\wedge A}(B) ),

e usarmos o teorema da função associativa, então obtemos:

g\left(\Phi_{C}(A \wedge B)\right) = g\left(\Phi_{C}(A)\right) g\left( \Phi_{C\wedge A}(B) )\right)

E agora posso simplesmente regraduar minha definição de plausibilidade. Uma vez que g() é monotônica, e portanto vai preservar a ordem com que eu classifico coisas como mais ou menos plausíveis, eu posso redefinir plausibilidade como:

\phi(A|B) = g(\Phi_{B}(A))

Mudei ligeiramente a notação para que o leitor possa apreciar melhor o que acontece com a antiga expressão que define G(⋅ , ⋅) com essa nova definição de plausibilidade:

\phi(A \wedge B | C) = \phi(B|C \wedge A) \phi(A|C)

Mas veja se essa não é a boa e velha regra do produto da teoria de probabilidades!!! Usando a comutatividade de \wedge eu ainda posso notar que:

\phi( B | C \wedge A) = \dfrac{\phi (A|C \wedge B) \phi (B|C)}{\phi (A|C)},

e essa não é nada mais que a regra de Bayes da teoria de probabilidades!

Mas calma, a nova função plausibilidade \phi(\cdot| \cdot) ainda não é uma probabilidade: não basta seguir essas duas regras, há uma série de condições na teoria axiomática de probabilidades para chamar algo com esse nome e a nossa função ainda não satisfaz todas. Tudo bem: ainda nos falta estudar as propriedades de F(\cdot)! Quem sabe isso ajude.

Novamente precisamos criar uma situação em que a demanda por consistência delimite as propriedades da função plausibilidade. Por exemplo temos a seguinte situação(5):

\phi(A \wedge B | C) = \phi(B|C \wedge A) \phi(A|C) =F\left(\phi(\neg B|C \wedge A)\right) \phi(A|C) .

Mas, pela regra do produto que deduzimos acima:

\phi(\neg B |C \wedge A) = \dfrac{\phi(A \wedge \neg B |C)}{\phi(A|C) }

e então:

\phi( A \wedge B | C) =\phi(A|C) F \left( \dfrac{\phi(A \wedge \neg B |C)}{\phi(A|C) }\right)

Mas lembre-se que a conjunção A \wedge B é simétrica, portanto toda essa expressão fica invariante se eu trocar A por B. E assim:

\phi(A|C) F \left( \dfrac{\phi(A \wedge \neg B |C)}{\phi(A|C) }\right)=\phi(B|C) F \left( \dfrac{\phi(B \wedge \neg A |C)}{\phi(B|C) }\right)

Se isso deve valer independente de quais são as proposições A, B e C, então eu posso, por exemplo, escolher uma particular proposição \neg B = A\wedge D. Note que com essa escolha temos as seguintes identidades: A\wedge \neg B = \neg B\neg A \wedge B = \neg A. Então:

\phi(A|C) F \left( \dfrac{\phi(\neg B |C)}{\phi(A|C) }\right)=\phi(B|C) F \left( \dfrac{\phi(\neg A |C)}{\phi(B|C) }\right)

\phi(A|C) F \left( \dfrac{F\left(\phi( B |C)\right)}{\phi(A|C) }\right)=\phi(B|C) F \left( \dfrac{F\left(\phi(A |C)\right)}{\phi(B|C) }\right)

O que finalmente resulta em mais uma equação funcional para F(⋅):

uF \left( \dfrac{F\left(v\right)}{u }\right)=v F \left( \dfrac{F\left(u\right)}{v }\right)

Novamente sem demonstrar, vou simplesmente afirmar que a solução mais geral dessa equação, submetida à condição de idempotência que deduzimos acima, é dada por:

F(u)^\alpha=(1-u^\alpha).

Note que para um \alpha qualquer isso restringe o dominio da função F(⋅), e portanto a imagem da função \phi(\cdot|\cdot), ao intervalo [0,1]. E veja o que acontece então com a regra que define F(⋅):

\phi(\neg A | B) ^\alpha + \phi(A|B)^\alpha = 1

Uma nova regraduação permite definir uma função Pr(A|B) =\phi(A|B)^\alpha com as seguintes propriedades:

  • Pr(A|B)\in[0,1]
  • Pr(A|B) + Pr(\neg A|B) = 1
  • Pr(A_1\wedge A_2|B) = Pr(A_2| B \wedge A_1)Pr(A_1 |B)

Esses não são exatamente os axiomas de Kolmogorov para a teoria de probabilidades mas… close enough para um post de blog. Isso tudo pode ser refinado com o devido grau de rigor matemático para satisfazer os exatos axiomas da teoria da probabilidade.

O que foi obtido com essa massagem matemática toda?

  1. É possível definir um sistema lógico de inferência baseado em informação incompleta e incerteza que atribui uma plausibilidade a cada proposição.
  2. Esse sistema lógico é único, a menos de uma regraduação monotônica da função plausibilidade. Isso faz com que uma ordenação segundo a plausibilidade seja única, uma vez que regraduações monotônicas não alteram essa ordem.
  3. A função plausibilidade satisfaz todas as regras que uma probabilidade legitima deve satisfazer (aqui não provei isso, mas apenas mostrei algumas coisas – para fazer isso rigorosamente precisa-se definir uma “sigma-álgebra de proposições”).

E qual é a utilidade prática disso? Bem… o mundo está cheio de situações de inferência baseada em informação incompleta. Particularmente, todo problema que depende de dados empíricos é, em essência, um problema dessa natureza e todo problema de inferência em ciência é assim. Uma vez que o único sistema de inferência para informação incompleta – como aí mostrado – é aquele que usa as regras  da teoria da probabilidade é razoável se supor que efetivamente usar essas regras explicitamente oferece vantagens sobre os métodos estatísticos ad hoc frequentemente usados, como os métodos de mínimos quadrados e outras formas de fitting de dados. Na verdade esse processo de inferência vai muito além disso – ele oferece ferramentas de modelagem física, de interpretação de modelos, de planejamento de experimentos e ainda mais. Mas disso eu vou tratar em um próximo post.

Notas:

(1) — Se você se interessa por nomes, o que se segue é devido a um certo número de pessoas — Edwin Jaynes, Harold Jeffreys e particularmente Richard Cox.

(2) — Estou usando os seguintes simbolos para os conectivos lógicos:

  • \neg — negação: \neg \mbox{Verdadeiro} = \mbox{Falso}
  • \wedge — o conectivo E (conjunção): \mbox{Verdadeiro} \wedge \mbox{Falso} = \mbox{Falso}
  • \vee — o conectivo OU (disjunção inclusiva): \mbox{Verdadeiro} \vee \mbox{Falso} = \mbox{Verdadeiro}

(3) — Lembre-se: queremos um sistema racional de atribuir um grau de confiança a algo.

(4) — Que pode ser obtida fazendo: u = \Phi_{B}(A_1), v = \Phi_{B \wedge A_1 }( A_2)) e w = \Phi_{B\wedge A_1 \wedge A_2 }( A_3).

(5) Note que eu tinha definido F(⋅) para a função original \Phi_{A}(B). Entretanto fizemos uma regraduação monotônica então nada me impede de abusar da linguagem e redefinir F(x) \to F(g(x)).

Referências:

[1] E. T. Jaynes, Probability Theory, the Logic of Science.
[2] A. Caticha, Lectures on Probability, Entropy, and Statistical Physics — arXiv:0808.0012v1 [physics.data-an]
[3] A. Caticha,  Quantifying Rational Belief — arXiv:0908.3212v1 [physics.data-an]

Contribuindo para o FQXi…

quinta-feira, 12 nov 2009; \46\America/New_York\America/New_York\k 46 Deixe um comentário

O FQXi, Foundational Questions Institute, tem como objetivo disseminar a pesquisa em áreas fundacionais da Física e da Cosmologia.

Em Agosto/09, eu fui convidado a integrar os blogueiros do FQXi 😈 . E minha primeira participação acabou de ser posta online (sim, a coisa demorou pra acontecer porque existe todo um processo de editoração e revisão por pares 😎 ):

Na verdade, o artigo que eu escrevi ficou “grande demais”… então, ele foi dividido em 3 partes, e esse link é pra primeira parte, que foi ao ar ontem. As outras partes vão se seguir… mas eu ainda não sei quando serão postas online. De qualquer forma, fiquem ligados, eu ponho os links aqui conforme eles forem aparecendo. 😉

Espero que vcs gostem… e, apesar de estar em Inglês, o Google Translate é seu amigo. :mrgreen:

Diversão garantida… ou sua Física de volta! 😈

Continuação analítica da função de partição…

sexta-feira, 6 nov 2009; \45\America/New_York\America/New_York\k 45 Deixe um comentário

Continuando no espírito dos posts Teorias Topológicas de Campo e suas Continuações Analíticas e Grothendieck, Sistemas Dinâmicos, Dualidade de Langlands e Higgs Bundles, mais um ingrediente pra temperar essa mistura, dessa vez vindo de Materia Condensada,

Essencialmente, nos dois primeiros artigos, Lee e Yang demonstram o chamado Teorema de Lee-Yang — essencialmente, o teorema mostra que, sob “certas condições” (é muito importante que essas condições sejam satisfeitas), os zeros da função de partição são imaginários; esses são os chamados zeros de Lee-Yang.

Por outro lado, os chamados zeros de Fisher têm origem numa construção muito semelhante a anterior, a diferença relevante entre ambas as construções sendo que, no caso de Fisher, a temperatura é continuada analiticamente [para os Complexos].

Nesse sentido, a construção de Fisher pode ser considerada a continuação analítica dos resultados de Lee-Yang.

A pergunta que se põem sozinha é: “Será que é possível fazer o mesmo em QFT e em Teorias de Gauge?” 💡

A resposta está longe de ser trivial ou conhecida, vide os dois primeiros posts linkados acima. Mas, agora, com um caso mais concreto pra se comparar… quem sabe não é possível se aprender alguma coisa…?! 😉

A semana nos arXivs…

terça-feira, 3 nov 2009; \45\America/New_York\America/New_York\k 45 Deixe um comentário


'Mike's motto'

'Mike's motto'

Grothendieck, Sistemas Dinâmicos, Dualidade de Langlands e Higgs Bundles…

sábado, 31 out 2009; \44\America/New_York\America/New_York\k 44 Deixe um comentário

Por falta de coisa melhor pra fazer num sábado de Halloween, à noite, …, eu estou aqui, lendo o artigo

e pensando na conexão dele com Local Dynamical Systems e Dinâmica Topológica (juntamente com Topological entropy), principalmente no contexto de Higgs bundles and local systems ou The Self-Duality Equations on a Riemann Surface — isso pra não falar em A mad day’s work: from Grothendieck to Connes and Kontsevich The evolution of concepts of space and symmetry, ou, melhor ainda, na continuação analítica de TFTs.

Taí o que me tira o sono… 👿

(Atualizado (2009-Nov-01 @ 11:30h): Pra “apimentar” ainda mais essa mistura toda, pensar em termos de Discrete gauge theory: from lattices to TQFT também corrói…, afinal de contas, o T. Tao, acima, descreve tudo de modo simplicial, combinatório — e o que é Lattice QFT senão uma versão discretizada, simplicial, de QFTs contínuas? 😛 E já existem técnicas robustas pra se discretizar via ‘lattices’ que não são apenas o ingênuo ‘lattice’ cúbico — muito dessa tecnologia foi desenvolvida pra simulações numéricas de GR; aliás, mais ainda, hoje em dia, já é possível até se construir ‘lattices’ supersimétricos. Resumindo: no final das contas, é possível até se pensar em simulações numéricas dessas construções! 😯 )

Mas, agora é hora de fazer uma boquinha… 😎

P.S.: Claro, o relógio abaixo também me tira o sono… 😈

Suunto Elementum Terra with the negative display and the stainless steel bracelet

Suunto Elementum Terra with the negative display and the stainless steel bracelet

O realejo do dia…

quinta-feira, 29 out 2009; \44\America/New_York\America/New_York\k 44 Deixe um comentário

Pra quem não conhece, o Marcus du Sautoy, além de professor de matemática em Oxford, é o atual autor da coluna Sexy Maths (Matemática Sexy) no Times de Londres.

A palestra dele no TED foi muito bacana — por isso mesmo, eu a reproduzo abaixo.

Something happens which is not observable: [Pierre] Curie’s more phenomenological approach led him to emphasize the role of “non-symmetry”, rather than symmetry, so that he was the first to appreciate the role of symmetry breaking as a necessary condition for the existence of phenomena.

De saidêra, deixou os comedinhas abaixo,

😈

A semana nos arXivs…

terça-feira, 20 out 2009; \43\America/New_York\America/New_York\k 43 1 comentário


E, pra quem ainda não sabe, o Michael Green (um dos autores dos volumes Superstring theory: Introduction e Superstring theory: Loop Amplitudes, Anomalies and Phenomenology — ainda um dos melhores livros sobre o assunto) foi o escolhido pra substituir o Hawking na Cátedra Lucasiana: Michael Green elected to Hawking’s Cambridge post — entre outros, o Witten e o Maldacena declinaram a oferta.

%d blogueiros gostam disto: