Posts Tagged ‘mecánica cuántica’

Ingredientes de una “cronomecánica cuántica”

marzo 13, 2014

Una amiga, a raíz de ver la película “El efecto mariposa” me preguntó como podía interpretarse la película en términos de la mecánica cuántica. La pregunta es interesante porque, al fín y a la postre, uno de los alicientes de las películas de ciencia ficción es intentar especular sobre la parte científica que normalmente sólo se suele esbozar, y generalmente de mala manera. Aparte de la película había mas alicientes para pensar en el tema del tiempo en física dónde tenemos cosas como soluciones de la relatividad general que implican trayectorias que llevan hacia atrás en el tiempo (son sus consecuentes paradojas), taquiones, que, de existir, podrían enviar señales al pasado (ver Taquiones y viajes en el tiempo, o la ecuación de Wheler-de Whitt, que resulta de poner la relatividad general en un formalismo canónico en la cuál, en cierto modo, no existe el tiempo. De hecho en un momento dado un grupo de inversores amigos de la especulación en física con tintes filosóficos, la FQXI, dedicó uno de sus premios anuales a la cuestión de la física del tiempo, sin gran éxito ya que en mi opinión ninguno de los artículos enviados era particularmente bueno. De hecho, espero, esta entrada debería ser mas interesante que cualquiera de esos artículos ;). Y eso que ni siquiera pretendo que sea del todo seria xD.

images

Bien, en la película tenemos un chaval, estudiante de psicología, que a raíz de unos experimentos con bichos adquiere una habilidad para conseguir que cada vez que hay un aspecto trágico en su vida desencadenado de manera muy clara por un acontecimiento concreto es capaz de enlazar con una realidad en la que el acontecimiento sucedió de manera diferente y vivir las consecuencias de esa versión alternativa. Supongo que los autores de la película pueden haberse inspirado en la interpretación de Everett de la mecánica cuántica en la que cada vez que se produce una medida cuántica hay una división de la realidad de tal forma que se forma un universo diferente para cada una de los posibles resultados de la medida. Claramente eso lleva a intentar enfocar el tema del tiempo desde una perspectiva cuántica, y eso es lo que hice. Desde entonces, a ratos libres, he ido perfilando un poco más el asunto, entre otras cosas porque, de tanto en tanto, alguien me lo recuerda. He intentado escribir algo sobre el tema en el pasado, pero siempre que me había planteado escribir me ponía a reanalizar el asunto y siempre se me ocurrían cosas nuevas que considerar y terminaba por no escribir nada. Ahora, ya por fín, me decido a dejar algunos detalles de cómo he ido enfocando el tema.

El punto de partida es a la vez sencillo y delicado. Recordemos la base de la mecánica cuántica no relativista elemental. Si alguien no sabe nada de cuántica puede probar a leerse mi post de introducción a la misma Introducción a la mecánica cuántica Tenemos una función de onda \phi( x,y,z,t) cuyo valor al cuadrado nos da la probabilidad de encontrar la partícula que representa esa función en el punto (x,y,z) en el instante t. Aquí t es el tiempo “newtoniano” que existe de manera universal y es igual en cualquier punto del universo. Por supuesto algo así no existe ya que la física Newtoniana debe ser sustituida por la de la relatividad general, en la cuál el tiempo forma parte de un cuadrivector. Pero por ahora ignoremos esa parte relativista. El planteamiento que hago es muy ingenuo, reinterpreto esa función de onda cómo la probabilidad de encontrar la función de onda en el punto (x,y,z) y, esta es la novedad, en el instante t. Por supuesto tras esta propuesta ingenua a nivel de lenguaje se esconde una gran dosis de sutileza ¿Cómo es eso de no poder saber en que instante se encuentra la partícula? Al fín y al cabo si estoy en un laboratorio tengo un reloj, y puedo saber en que momento he detectado la partícula. Vale, tenemos el principio de incertidumbre de Heisenberg tiempo-Energía que afirma (mas adelante entraré en las sutilezas de esta relación) que no podemos saber con total precisión a la vez el tiempo y la energía. Pero, al fin y al cabo, si tenemos suficiente energía, podemos medir con precisión arbitraria el momento de la medida.

Definitivamente en el universo newtoniano la propuesta no tiene mucho sentido, y es necesario ya meter conceptos de relatividad dónde tenemos las transformaciones de Lorentz (relatividad especial) y, mas generalmente, el efecto de la masa cómo ralentizadora del paso del tiempo (el tiempo transcurre mas lento cerca de un cuerpo pesado que en el espacio libre). En estas circunstancias no hay tiempo universal y debemos hablar de el tiempo propio relativista (asumo que todo el mundo conoce la paradoja de los gememolos y demás cosas típicas de la relatividad así que no daré explicaciones al respecto). \tau=\frac{t}{\sqrt(1-v^2/c^2)} en relatividad especial, o, mas generalmente \tau=g_{00}\dot (x^0) + \frac{g_{0i}}{\sqrt(g{00})} en relatividad general.

Bien, entonces, con el concepto de tiempo propio, ya tenemos un ingrediente para una forma posible (hay más) de interpretar eso de “probabilidad de hallar la partícula en el tiempo t”. La otra cosa que necesitamos es el concepto de reloj cuántico. Realmente es un concepto sencillo pero encontrar una forma rigurosa de exponerlo es ligeramente mas complejo. La idea es tener un dispositivo que tenga una parte con un comportamiento periódico y otra que permita construir a partir de ese comportamiento un número que represente el tiempo transcurrido desde que el dispositivo empezó a funcionar. Y, se supone, que ese chisme debe ser lo bastante pequeño para que los efectos cuánticos sean apreciables claro, que sino cualquier reloj convencional valdría. Siendo un sistema cuántico compuesto de varias partículas lo vamos a poder representar por una función de onda conjunta \phi(\vec(r_1), \vec(r_2), ..., \vec(r_n), t) Bien, aquí se supone que todas las partículas del reloj están en el mismo tiempo. Esto lo interpretamos cómo que no tenemos ningún dispositivo más pequeño que el propio reloj que nos permita medir el tiempo de manera separada para cada una de las partículas. Asumimos, además, que las partículas del reloj se mantienen siempre confinadas en un volumen concreto (el tamaño del reloj) y que dentro de ese volumen el campo gravitatorio es aproximadamente constante. En esas condiciones el reloj lo que hace es medir su propio tiempo propio, y ese t sería el \tau .

Con el tiempo propio, y el reloj cuántico para poder medirlo, ya podemos dar sentido a eso de “probabilidad de hallar la partícula (sistema cuántico) en el tiempo t). Imaginemos que hacemos un experimento de doble rendija con nuestro reloj cuántico, pero con una pequeña variante. Por una rendija el reloj viaja por un espacio-tiempo plano, por la otra pasa cerca de un miniagujero negro (o cualquier otra cosa lo bastante densa para introducir un retraso temporal que puede discernir el reloj cuántico). Obviamente si pasa por el espacio-tiempo plano el tiempo propio que le lleva al reloj llegar desde el punto de partida al final va a ser mayor que si pasa por la rendija cercana al microagujero negro. Pero, claro, cómo en cualquier experimento de doble rendija no sabemos por dónde pasó exactamente el reloj cuántico y lo que tenemos es que en el resultado final vamos a encontrar que una vez medimos un valor t1 y otra un valor t2 (en realidad, si tenemos un microagujero negro, podríamos tener muchos valores posibles si al pasar por la rendija del agujero negro el reloj pudiera pasar por diferentes distancias al mismo). Visto así, no podemos medir el tiempo propio y el tiempo no está determinado. Esta idea es un poco discutible ya que podría argumentarse que hay una cierta redundancia. Al fin y al cabo lo que tenemos es que la función de onda conjunta estaría en un estado de superposición entre dos de autovalores posibles que consideramos cómo “marca temporal”. En realidad, como veremos, el “tiempo” normalmente va a ser una información menos detallada que un autoestado así que tal vez se podría obviar ese posible criticismo. Aunque esta exposición de el concepto de reloj cuántico la he elaborado yo en su totalidad soy consciente de que hay mas gente que ha trabajado en esta idea y que incluso se ha hecho alguna implementación experimental de la idea. Recuerdo que Sabine Hossénfander mencionó en su blog ese experimento , pero no he dado con el link al post en concreto.

Para poner un ejemplo concreto podríamos considerar que nuestro reloj cuántico fuese un conjunto pequeño de átomos con algunos electrones excitados en algún estado metaestable. Con el paso del tiempo estos electrones irían decayendo al estado fundamental (el periodo de decaimiento al estado fundamental sería el ingrediente “periódico” del reloj) y podríamos usar el número de electrones medidos en el estado fundamental cómo “el tiempo transcurrido”. Aquí hay varios autoestados compatibles con un número concreto de electrones en el estado fundamental (porque no nos importa en que núcleo concreto se ha producido la caída al estado excitado). Es interesante el hecho de que aquí el tiempo es discreto, mientras que en física siempre es una variable continua. En teoría siempre podemos hacer un “reloj cuántico” mas preciso (al menos hasta llegar al tiempo de Planck, y según mucha gente incluso más allá) pero, en la práctica, podríamos argumentar que para estudiar nuestro sistema no podemos contar con mas información temporal que la que nos da el reloj cuántico mas preciso que tenemos.

La cosa se vuelve mas divertida cuando usamos estos relojes cuánticos en este tipo de casos para tomar medidas temporales de otros acontecimientos. Tomemos el caso de dos naves espaciales. Una viaja de A a B por una zona plana y otra cerca de un agujero negro. Esas naves usan relojes atómicos para medir el tiempo. Cómo esos relojes no tienen bien definido el tiempo cualquier evento lleva automáticamente indefinido el tiempo y así las funciones de onda que representen procesos cuánticos en esas naves no tendrían el tiempo bien definido. Dejo al lector que rellene los detalles de experimentos concretos que ilustren de forma rigurosa esta idea, que no voy a hacerlo todo yo :P.

Vale, asumamos que lo explicado anteriormente se sostiene (es un tema abierto a discusión, claro). En ese caso vamos a proceder a hacer un formalismo naive para añadir eso y crear nuestra “cronomecánica cuántica”. Recordemos que en mecánica cuántica tenemos dos operadores fundamentales, el operador momento \hat p \phi=-\frac{i\hbar\partial_x }{2m} \phi y el operador posición \hat x\phi=x.\phi . La justificación del operador x, básicamente, es la de obtener el valor mas probable de la posición, y eso en una variable estadística, es la media (osea, multiplicar por x y sumar/integrar x multiplicado por la distribución estadística, osea, la función de onda. Otra gente interpreta ese operador cómo trasladar en una distancia x la función de onda, pero, la verdad, yo prefiero la interpretación probabilística. Cómo quiera que se vea eso permite que, inmediatamente, el operador “posición temporal” sea multiplicar la función por t, i.e. \hat t \phi= t.\phi .

El operador análogo al operador momento es mas delicado. El operador momento se interpreta cómo el generador infinitesimal de las traslaciones (ver, por ejemplo Operadores de la mecánica cuántica. Entonces, podríamos decir que el operador “Cronos” \hat c= -\frac{i\hbar}{2m}\partial_t genera las traslaciones en el tiempo. Si admitimos eso podríamos hallar las relaciones de conmutación entre los dos operadores y comprobar que son las mismas que entre los operadores x y p i.e. [\hat x, \hat p]= \hat x \hat p - \hat p \hat x= i\hbar es decir [\hat t, \hat c]= i\hbar . Hasta aquí todo parece sencillo y sin sutilezas. El problema surge cuando uno se da cuenta que ya hay un operador casi idéntico a lo que yo he llamado operador Cronos, el “operador energía” que es igual en todo excepto en el factor de 2m dividiendo. Este “operador energía” aparece en la ecuación de Schröedinger dependiente del tiempo \hat H \phi = -i \hbar \partial_t \phi y en la ecuación de Klein-Gordon, dónde es mas evidente que juega el papel de la energía ya que ahí se coge la relación clásica entre el trimomento y la energía: E^2= p^2 + m^2 c^4 y se sustituye la E por el “operador energía” para obtener la ecuación de Klein-Gordon (para mas detalles ver en la wiki la Ecuación de Klein-Gordon.

Esto del “operador energía”, cómo digo, es algo curioso. Al fin y al cabo en mecánica cuántica la energía es el hamiltoniano. Además, resolviendo la ecuación de Schröedinger dependiente del tiempo se puede ver que el hamiltoniano es lo que genera la evolución temporal del sistema cuántico, en analogía al operador momento que general la traslación espacial. Resulta curioso también que el “operador energía” no incluya la masa. Mi “operador cronos” si incluye esa masa, y, formalmente, uno podría pensar que también debería generar las traslaciones en el tiempo. Sobre la presencia o no de la masa se puede argumentar que en un sistema general la masa si influye y no evolucionan en el tiempo de la misma manera dos partículas de distinta masa (eso sólo pasa en el campo gravitatorio, pero no en, por ejemplo, un campo magnético) por lo cuál sería mejor “operador energía” mi operador cronos que el normal. Por otro lado, si se hace eso, no se obtiene la ecuación de K-G.

Que el operador cronos se pudiera interpretar como una energía sería interesante porque aquí la incertidumbre tiempo-energía tendría la misma interpretación que en el caso de la posición y el momento. Normalmente la relación de incertidumbre tiempo-energía, se interpreta cómo que en una transición entre dos estados separados por una energía E si queremos medir esa energía con una precisión dada necesitamos al menos un tiempo de observación que cumpla esa relación de incertidumbre. Eso también lleva al concepto de partícula virtual en la que si no “miramos” durante un tiempo t se puede formar una partícula con energía E compatible mediante la relación de incertidumbre con el tiempo que estamos sin “mirar”.

Cómo, por supuesto, esta teoría no pretende ser totalmente seria no he examinado a fondo estos aspectos, tampoco he mirado otras temas de compatibilidad ¿conmutan estos operadores que he introducido con el hamiltoniano para poder ser observables?

En todo caso, asumiendo que hay una relación entre mi operador C y la energía podemos ir un poco más allá. El operador C tiene, en general, espectro continuo con valores negativos y positivos, como el operador t. Eso vendría a interpretarse cómo que tenemos partículas yendo hacia delante y hacia atrás en el tiempo, y tendríamos una visión de las antipartículas cómo los autoestados negativos del operador C. Una vez más no he analizado a fondo el asunto, y dejo en manos de alguien potencialmente interesado que lo haga si le apetece divertirse con un tema desenfadado cómo es este.

Vale, una vez expuesto el “formalismo” de la cronomecánica cuántica vamos a aplicarlo a jugar un poco más con él. Cuando tenemos algún caso de paradojas temporales, es decir, que viajamos por una curva de tiempo cerrada y partiendo de un tiempo t1 llegamos a un tiempo t2 dónde t2th a otro t1<th. Aquí ya tenemos un problema posible al intentar hacer superposiciones cuánticas ya que las partículas antes y después del th no son iguales. Por ejemplo, un bosón vectorial Z tiene masa después de th y es de masa 0 antes de th. Sí hacemos volver una partícula Z en el tiempo a través de una de esas curvas de tiempo cerrado tendríamos que considerar un estado de superposición entre una partícula sin masa y otra con masa, y con distintos grados de liberad además. En realidad en cuántica de campos el observable es el campo y podríamos decir que en t<th crea partículas sin masa y despúes partículas con masa. En cualquier caso eso de hacer superposiciones de estados que pertenecen a vacíos distintos es algo que se supone que está prohibido en cuántica por las reglas de superselección y no debería poder hacerse. Entonces, si conectamos estados temporales dónde el vacío cuántico ha cambiado nuestro formalismo de superposición cuántica de estados ya no valdría y deberíamos buscar algo más sofisticado.

descarga

Otro tema mas divertido aún en esto de las paradojas temporales y la definición del tiempo es jugar con cuerdas. Imaginemos que la teoría de cuerdas es correcta y que cogemos una cuerda elemental y la hacemos crecer hasta un cierto tamaño macroscópico (esto es algo que Witten argumentó que podría haber ocurrido en el periodo inflaccionario y tener cuerdas cósmicas que fuesen cuerdas elementales agrandadas en vez de las asociadas a rupturas de la simetría, que son el otro tipo de cuerdas cósmicas posibles). Se supone que una cuerda tiene un tiempo bien definido. Ahora bien, si extendemos una cuerda macroscópica en una curva de tiempo cerrada sus diversos puntos estarían, en general, en tiempos diferentes, y, si la hacemos girar, estaría mandando hacia atrás en el tiempo a una parte de si misma. Por supuesto esto es un ejemplo muy tramposo porque el propio campo gravitatorio de esta cuerda cósmica fundamental seguramente sería lo bastante intenso para romper la geometría que permite la existencia de esas curvas de tiempo cerradas. En realidad existe algo llamado el principio de protección cronológica, introducido por Hawking, que argumenta (pero no demuestra) que siempre va a haber efectos cuánticos que arruinan la geometría clásica con curvas de tiempo cerradas. En su libro de agujeros de gusano Matt Visser hace un cálculo de teoría cuántica de campos que demuestra (al menos en buena parte) que esos efectos cuánticos destruyen el agujero de gusano cuando este intenta usarse cómo máquina del tiempo.

Otras cosa que, por ejemplo, se podría considerar con este formalismo que he introducido es ¿que pasa con el operador de ordenación temporal en teoría cuántica de campos? Y bastantes otras cosas (he considerado unos cuantos aspectos más, pero me llevaría demasiado espacio discutirlos). En cualquier caso, la verdad, no creo que el tema merezca meterse en tantas profundidades. Considero este "formalismo" cómo una guía práctica para tratar con algo de sentido, y un criterio concreto, las paradojas temporales que le gusta analizar a la gente de CF y poco más. Pero si alguien quiere profundizar en el tema y exprimir más el formalismo libre es ;).

Quantum mechancis in your android device

mayo 23, 2013

El título es una paráfrasis del libro Quantum Mechanics Using Computer Algebra: Includes Sample Programs in C++, SymbolicC++, Maxima, Maple, and Mathematica .

Esta es la segunda edición. La primera tenía el mismo título, pero cambiaban los entornos en los que se ofrecía software. En particular -de cara al propósito de ésta entrada- en vez de máxima usaba reduce. Cualquiera que haya seguido recientemente el blog adivinará que la parte de máxima esta justificada por la reciente versión de máxima para android. Si menciono la primera edición y reduce es porque resulta que también existe una versión de reduce para android. Aviso, cómo ahí explica hay dos reduce para android, el que enlazo y uno que se llama Android reduce. El primero es un entorno que incluye toda la funcionalidad pero que debe ejecutarse desde la línea de comandos. El segundo es una aplicación visual que permite hacer una serie de operaciones mediante una interfaz visual que, por debajo, llaman al core. Ah, y, por supuesto, en android hay varios compiladores de C++ (de symbolic C++ no lo sé, acabo de enterarme de que existe eso xD) así que también puede usarse ese código con uno de los compiladores.

En definitiva, que en ese libro vamos a tener un montón de código para resolver problemas típicos de mecánica cuántica, desdealgunos muy elementales hasta tópicos mas avanzados como teoría de perturbaciones, scattering, etc. También incluye algunos temas que podrían considerarse mecánica cuántica relativista, cómo las matrices de Dirac. Un fallo de la primera edicion es que no contiene ningún diskette/CD-ROM (es del 1995, por esa época no había nada mas sofisticado, y bueno, tampoco hace falta un DVD o blue ray para meter ese código y si acaso las versiones de los programas), no sé si la segunda versio´n lo incluirá, esperemos que sí.

Por cierto, cómo habréis podido ver en la web es tienen algunos pdf com parte de los primeros capítulos que incluye algo de software. Un código de máxima sacado de ese capítulos es el siguiente: /* wavepacket.mac */
depends (psi,x,psi,t);
depends (f1,x,f1,t);
depends (f2,x,f2,t);
f1: B/(sqrt(1+%i*hb*t/(m*a2)));
f2: exp(-(x*x)/(2*a2*(1+%i*hb*t/(m*a2))));
psi: f1*f2;
res1: hb*hb*diff(psi,x,2)/(2*m);
res2: %i*hb*diff(psi,t);
result1: (res1+res2)/f2;
result2: expand(result1);
print(result2);

He probado a ejecutar ese código en el maxima para windows y el de android y en ambos se ejecuta correctamente. Hay alguna diferencia eso sí. En el de windows se puede hacer copy & paste de todo y darle a ejecutar y funciona, haciendo todos los cálculos de un tirón. En el de Android eso no va y he tenido que ir copiando el código línea por línea, lo cuál es un poco pesado. En la práctica eso no sería problema porque lo suyo es poner este código en un archivo de texto (extensión txt, max o mac) y cargarlo con el comando load( path del archivo). Aviso, lo de las rutas en linux/android son un poco lio par ala gente que está acostumbrada a windows. Si ponéis los scripts de máxima en una carpeta llamada “maximaScripts” de la microSD que viene con el dispositivo (microSD0 cómo suelen llamarla los exploradores de archivos) tenéis que escribir como ruta: “/mnt/microsd/maximascrips.nombrearchivo.mac” (espero no haberme equivocado que lo estoy escribiendo de memoria).

También probé a ejecutar algo de código de reduce e igualmente funciona correctamente en la versión para android. Para cosas tan sencillas (a nivel de proceso) cómo estas el tiempo de ejecución (probado en un note 10.1 y en un note II – ambos con cuatro núcleos a 1.4 y 16 Ghz respectivamente, y 2 GB de RRAM) es despreciable y no se puede notar ninguna diferencia al tiempo que tarda en ejecutarse en un PC (AMD fusion de 6 núcleos a 3.2 GHZ, y 14 GB de RAM). Por supuesto para cálculos complejos la potencia es importante, pero al fin y al cabo la primera versión del libro se escribió para ordenadores 486, o si acaso Pentium, con velocidades de reloj del orden de los 100 MGHZ y con una memoria que podría ir entre uno 8 y 32 MB de RAM. Vale que los micros de ARM para móviles no son tan potentes cómo sus correspondientes actuales de PC, pero sin duda le dan mil vueltas a los ordenadores de esa época.

Aparte de esté código de mecánica cuántica también testeé el maxima de android con algo de cálculo tensorial, en particular le pedí que me sacase el tensor de Ricci a partir de una métrica. Una vez más el cálculo lo hizo de manera casi instantánea y no hubo diferencia apreciable al tiempo que requiere el mismo cálculo en el PC de sobremesa. Eso sí, hacer el mismo cálculo a mano podría requerir horas, así que ahí se ve lo fantástico de tener este tipo de potencia de cálculo en un dispositivo que puedas llevar a cualquier lado, en particular porque éste tipo de cálculos son los que suele necesitar un físico teórico. Incluso si alguien trabaja en teoría de cuerdas se va encontrar con la necesidad de hacer cálculo tensorial, no digamos ya si trabaja en agujero negros en teoría de cuerdas. Con estos packages de cálculo, los libros y artículos que puedes llevar en el tablet, y un stylus para escribir prácticamente hay todo lo que se puede necesitar para hacer física teórica cómodamente. Por supuesto en un tablet windows 8 con stylus aparte de estos programas tienes mathematica y maple, que aún no están portados para android, y que tienen mas scripts en la red para más tareas, pero pese a ello uno se puede apañar mas que dignamente con lo que ya hay. En el peor de los casos si uno quiere un mathemática puede pagar por ese invento extraño del wolphram alpha pro que da una funcionalidad muy similar a mthematica, pero en versión en la nube (que es un tipo de informática que detesto, y no digamos ya de pago, as´ique conmigo que no cuenten xD).

Bien, esto de poder comprar un libro es fantástico, pero sería interesante tener -cómo anticipé- material para descargar desde la web. Hay varias páginas. Por ahora la más interseante que he encontrado (par aun teórico) es MAXIMA BY EXAMPLE: DETAILED EXAMPLES OF THE USE OF THE MAXIMA COMPUTER ALGEBRA SYSTEM escrita por el físico Edwin L. (Ted) Woollett.

Por supuesto si uno sube de nivel sería interesante tener software para hacer cálculo de cosas cómo el espectro de una teoría supersimétrica a partir de su Lagrangiano, o algo para hacer diagramas de Feynman, o vaya usted a saber qué. Cómo dije antes mucho de ese software está para mathematica y mapple, que por ahora no están disponibles en Android. Pero si hay mucho para matlab, y si está para matlab está para Octave, que si está disponible en android. En fín, no nos vamos a engañar, para windows sigue habiendo mas material, pero comparado a lo que había hace un año ahora tenemos Maxima, Octave, mathstudio y reduce (por citar los mas importantes) y teniendo en cuenta que no hay móviles con windows 8 y sí con android y que lo mejor es poder compartir todo el software en el móvil, en el tablet y en el ordenador, y que eso sólo puede hacerse con Android, pues está claro cuál es el camino. Bueno, en el futuro próximo los de Ubuntu van a sacar una versión de Linux para móviles y tablets, y par linux ya sí que hay prácticamente lo mismo que para windows.

Entiendo que hay mucha gente que tiene la idea de que lo suyo es dedicarse a la física en un despacho, con el ordenador al lado. O si acaso en una biblioteca, con un portátil. Pero eso limita mucho, yo quiero disponer de todo el material posble en cualquier lado, porque, a ver, ¿quien no ha quedado con amigos, estos se van a la discoteca, se pierden por ahí, y uno se queda aburrido (eso puede ocurrir incluso si los amigos no se pierden xD) sin nada interesante que hacer? Pues en esos caso se saca del bolsillo el note II y se pone a hacer física y si uno necesita calcular un tensor de Ricci que mejor que tener un software que lo haga y luego ya hacer a mano los cálculos que corresponda ;).

Por supuesto, si se es del grupo de gente alérgico a la tecnología siempre puede optar por opciones mas…clásicas xD.

Caos espectral en mecánica cuántica (o perturbación crítica)

mayo 15, 2013

Actualización: He modificado el título de la entrada para llamar a la teoría propuesta por un nombre mas descriptivo, y posiblemente mas llamativo también ;).

Hace unas fechas escribí una breve reseña sobre caos cuántico. La ligereza de la misma puede haber servido cómo pista de que no era un tema en el que hubiese profundizado demasiado, por decirlo suavemente. El motivo es que no era un tema que me hubiese resultado especialmente atractivo hasta ahora. Cómo dije ahí esa gente tiente a ocuparse de mecánica cuántica muy sencilla y -además- en última instancia no existe un análogo cuántico del caos clásico así que no terminaba de ver un buen motivo para profundizar en ese campo.

Con los precedentes anteriores uno podría plantearse cómo es que ahora dedico una segunda entrada al tema. El motivo proviene de algo aparentemente muy alejado de la mecánica cuántica: el cálculo numérico. Cómo parte de la titulación de matemáticas es necesario cursar al menos dos asignaturas sobre cálculo numérico. En el primer año se ven varios temas relativamente sencillos cómo cálculo de ceros de funciones, interpolación de funciones, integración/derivación numérica, resolución de sistemas lineales y, la parte mas extensa, álgebra lineal numérica.

En los cursos de álgebra lineal se aprende a calcular autovalores y autovectores de manera analítica. Cómo suele ser habitual el método que es eficiente para hacer algo con “lápiz y papel” dista mucho de ser el mejor para hacerlo mediante algoritmos en un ordenador. En el caso del álgebra numérica sucede lo mismo, pero, además, se aprenden algunos hechos tan interesantes cómo sorprendentes.

Recordemos que para calcular los autovalores de una matriz M uno debe hacer el determinante de \mid M -\lambda \mathbb{I} \mid . Esto da cómo resultado un polinomio en \lambda . Una vez se tienen las raíces de ese polinomio se sustituyen en la expresión \mid M -\lambda \mathbb{I} \mid y se calculan el/los autovectores correspondientes a ese autovalor. En los ejercicios típicos las matrices están “cocinadas” para que el polinomio tenga raíces enteras (o al menos alguna de ellas entera y que el resto puedan obtenerse a partir de ahí por el método de Rufini). Por supuesto en problemas reales no sucede eso casi nunca (no estoy 100% seguro pero creo recordar que en el conjunto de todos los polinomios los que cumplen eso tendrían medida nula -definiendo una medida más o menos natural en el espacio de polinomios, claro-). Por ese motivo, en la práctica, uno debería resolver el polinomio por métodos numéricos y luego implementar un algoritmo que calculase el autovector a partir de ese autovalor.

El caso es que esa tarea tan sencilla de calcular las raíces de un polinomio tiene sutilezas inesperadas. La clave del asunto es que polinomios muy similares pueden tener raíces no tan similares. Es decir, una pequeña incertidumbre en el valor de un coeficiente del polinomio se traduce en una gran diferencia entre los valores de las raíces, osea, cómo exclamaría Malcom: ¡CAOS!. Antes de seguir con consideraciones teóricas sobre esto dejo un ejemplo de matriz cuyo polinomio característico tiene esa sensibilidad:

A=\left(\begin{array}{ccc}    -149&-50&-154\\    537&180&546\\    -27&-9&-5    \end{array}\right)

Uno puede hacer el polinomio característico y verificar que sus raíces son {1,2,3}. Si uno modifica muy ligeramente esa matriz, por ejemplo modificando el segundo elemento de la diagonal de 180 a 180.01 podría comprobar (recomiendo usar algún programa informático) que las nuevas raíces el polinomio característico (vamos, los autovalores de la matriz), son { 0.207, 2.3008, 3.50} Es decir, una modificación de uno de los elmentos de la matriz del orden de 10^{ -5} modifica todos los autovalores en magnitudes entorno al 50% lo cuál es algo realmente impresionante. En los libros o manuales elementales sobre cálculo numérico no se suele comentar mucho más al respecto y se pasa directamente a enseñar métodos para el cálculo de esos autovalores (según en que manuales se limita al método de potencias para el cálculo del autovalor dominante) y autovectores (normalmente el método QR y variantes). Tampoco suelen hacer las cuentas de cómo cambian los autovectores así que me hice el cálculo para los dos casos anteriores. Para la matriz original los autovectores también son bastante distintos, con variaciones incluso mayores que las de los autovalores.

El caso es que para alguien con una base de física una matriz es, sobre todo, un operador cuántico (para un matemático una matriz puede ser un montón de cosas, y dependiendo del caso se la estudia de muchas maneras diferentes xD), los autovalores las autoenergías (si el operador es el hamiltoniano) y los autovectores las autofunciones de onda cuánticas. Y claro, inmediatamente (al menos yo es lo que pensé nada mas leer ese resultado) es que si un operador cuántico tiene un comportamiento tan exótico uno podría pensar que algo extraño podría pasar con Mary…digo la cuántica ;). El caso es que no pude dedicarme inmediatamente a profundizar en ese hecho chocante, pero siempre estuvo ahí en segundo plano, cómo una inquietud, y en cuanto se dió la oportunidad analicé más a fondo el asunto. La primera duda que surge es sí esa incertidumbre en el cálculo de autovalores es debida a errores de redondeo en algoritmos numéricos o si obedece a una causa mas fundamental. Rastrear en extensos libros sobre álgebra lineal numérica no me llevó a ningún lado pero una búsqueda en google me llevó a un foro dónde se trataban esos temas y ahí daban un ejemplo muy sencillo que -sí no interpreto mal- resuelve la cuestión. En concreto plantean el caso del poinomio \lambda^3 -\epsilon=0 cuya solución \lambda=\sqrt[3] \epsilon que no es derivable en el entorno de 0 y ese es el origen de la sensibilidad del polinomio. En la misma web mencionaban un ejemplo mas complejo de una matriz, dependiente de un parámetro, que originaba polinomios “sensibles” a variaciones de ese parámetro. Esa matriz era además simétrica (autoadjunta) lo cuál es bueno pues los operadores cuánticos deben ser autoadjuntos. Con eso ya se tiene bastante información relevante, el problema es “fundamental” y no de redondeo, se identifica el problema (o al menos un factor del mismo) y se pueden analizar familias de matrices, no una sóla.

La siguiente reflexión que a uno se le ocurre es plantearse cómo puede suceder esto con sistemas lineales. Al fin y al cabo la cuántica es lineal, y uno aprende, estudiando Sturn-Liouville (bien sea mediante análisis clásico o, de modo riguroso, en cálculo funcional) que la clase de operadores lineales autoadjuntos son buenos y maravillosos y nos dan una base del espacio de Hilbert de soluciones del problema ¿que más se puede pedir?. Bien, el caso es que bajo esa aparente inocencia los operadores lineales (incluidos los autoadjuntos) ocultan muchas sorpresas y uno, a poco que los estudie, se da cuenta de que son unos grandes desconocidos que guardan en su interior muchas pautas insospechadas. Pero, volviendo al principio, si la cuántica es lineal ¿de dónde surgen todas estas “sensibilidades”? Bien, los operadores son lineales, sí, pero las operaciones para extraer información de ellos (sus autovalores y autovectores en el caso de la cuántica) implican formar expresiones no lineales. La tarea de obtener el determinante es no lineal, y para calcular autovalores el resultado de la misma es un polinomio no lineal. Digamos que hay mucha no-linealidad escondida.

Bien, esa es la matemática, pero queda analizar un poco como afecta eso a la física. La idea básica -en un esquema meramente formal- es muy simple. Tenemos un sistema cuántico, todo lo particular que haga falta, cuyo hamiltoniano podemos considerar que es, en alguna base apropiada, una matriz finita. Los elementos de esa matriz en general van contener términos que se deben obtener de manera experimental (por ejemplo si es el hamiltoniano de un electrón en un campo eléctrico el valor de ese campo podría ser un dato experimental). Entonces eso significa que tenemos dos Hamiltonianos, H y H’ que difieren por una pequeña cantidad. Siguiendo la costumbre de teoría cuántica de perturbaciones podríamos escribir H'=H_0 + \epsilon H_1 aunque, en este caso, no nos importa (necesariamente) que H_0 sea resoluble analíticamente. La idea es que uno podría esperar que los autovalores de H y H’ fuesen muy similares (es el fundamento de la teoría de perturbaciones, en particular ahí se exige, cómo prueba de consistencia, que la diferencia entre un autovalor del sistema sin perturbar y el perturbado sea menor que la diferencia entre dos autovalores del sistema sin perturbar). Pero, cómo acabamos de ver, esto no siempre tiene porque suceder. Yo estudié esto por mi cuenta y elaboré un poco algunas consecuencias sencillas. Más adelante descubrí que hay una línea muy reciente de investigación, liderada por Michel Berry (el de la famosa fase de Berry) y llaman a esto “perturbación crítica”. Aún tengo que explorar mas el tema de lo que hace esa gente y cuanto se parece a lo que yo estoy considerando.

Pero sigamos con el quid de la cuestión. La idea es que dos sistemas con hamiltonianos muy similares pueden tener energías muy diferentes. Podría darse el caso medir el campo eléctrico del hamiltoniano con precisión de varios decimales y que pudiésemos resolver el problema y aún así los resultados no nos servirían para predecir, en la práctica los valores posibles de las energías. Pero puede ser peor aún, cómo los autovectores, que son las funciones de onda, también cambian mucho. Imaginemos que el campo eléctrico fluctua en el tiempo. Si colocásemos el sistema en un estado inicial de superposición y midiéramos las frecuencias con las que se da cada autovalor de la energía estas no tendrían una distribución probababilística. El motivo es que al fluctuar el campo fluctuan los autovalores y no siempre estamos trabajando con autoenergías similares. Y, cómo además varían los autovalores, las probabilidades de ocupar cada autovalor también fluctúan. Es decir, podríamos tener un sistema del que sabemos el Hamiltoniano con mucha precisión, poder resolverlo analíticamente, y aún así, en la práctica, no poder obtener ninguna información útil respecto a que nos vamos a encontrar.

Para tratar esos sistemas- creo yo, habría que optar por una descripción en términos de ecuaciones diferenciales estocásticas (para una introducción ver por ejemplo este pdf) en la que aparte del término determinsta (la ecuación de Schröedinger) habría un término de “ruido”. Eso sí, ese término no tendría porque ser browniano sino que su naturaleza dependería de la naturaleza analítica del parámetro del hamiltoniano que dicta la “sensibilidad” del mismo y podría bautizarse algo así cómo “ruido espectral”.

Para ir concluyendo hago una reflexión importante. Esto no es caos cuántico. En un sistema caótico clásico tenemos que la dinámica (el hamiltoniano) es fijo y hay sensibilidad en las condiciones iniciales (que no pueden medirse con precisión infinita). En cuántica el observable fundamental es la función de onda y no las posiciones/momentos. Y la unitariedad de la evolución cuántica implica que si las funciones de onda en un instante dado difieren por una cantidad pequeña esa diferencia se mantendrá constante en el tiempo. Esto plantea una duda conceptual de cómo si la realidad es cuántica en sistemas clásicos, que son el límite de los cuánticos (teorema de Erenfest) puede haber caos. Por supuesto mi argumento no implica que haya caos cuántico porque aquí lo que tenemos es algo distinto. Tenemos que el propio hamiltoniano (lo que dicta la dinámica) es el que está sujeto a una incertidumbre experimental y cómo consecuencia de la misma los observables cuánticos (autovalores, autofunciones) son muy sensibles a variaciones de esa incertidumbre. Por supuesto, y esto sería curioso de analizar en comparativas, en sistemas clásicos también hay esa incertidumbre en el valor exacto del hamiltoniano, y también hay operaciones de obtener autovalores y autovectores para obtener soluciones en algunos de esos sistemas (por ejemplo osciladores armónicos acoplados) así que esta sensiblidad extra, esta “perturbación crítica” afectaría por igual al mundo clásico y al cuántico, y tal vez (o tal vez no, vaya usted a saber xD) seria interesante comparar las diferencias entre ambos mundos para esos sistemas.

Para finalizar algunas palabras sobre lo que hace la gente de caos cuántico, que está relacionada con la naturaleza de los autovalores de los operadores audoadjuntos. Resulta, por ejemplo, que los hamiltonianos que presentan simetrías tienen una distribución de los autovalores muy diferente de los que no tienen simetrías (si se quieren buscar detalles usar los términos “quantum chaos, random matrix). Es un tema curioso, sobre el que tal vez lea mas, o tal vez no. Pero tras ver esto de la sensibilidad de los autovalores y que la distribución de los mismos depende de las simetrías del hamiltoniano está claro que bajo su inocente apariencia los operadores autoadjuntos tal vez puedan ocultar auténticos “animales patológicos” en su interior y que posiblemente la mecánica cuántica mas elemental guarde aún muchas sorpresas importantes en contradicción con la idea de que es un “animal doméstico y conocido”. Y eso si nos restringimos a cuántica elemental, y estudiando matrices finitas (a saber que pasa con las infinitas que son lo común en mecánica cuántica). Pero el caso es que las teorías cuánticas de campos también son, en el fondo, teorías cuánticas “normales” y, no sé ¿cómo podría ser el grupo de renormalización de un hamiltoniano de campos que fuera el análogo de uno de partículas “sensible”? ¿Tal vez el flujo de renormalización hiciese evolucionar el valor de las constantes de acoplo de manera caótica según nos movemos hacia energías mas altas? O, si la estructura de los autovalores depende de la simetría ¿que pasa en los fenómenos de ruptura espontánea de simetría?

En definitiva, que me da la impresión de que el formalismo de la mecánica cuántica convencional puede ser mucho, mucho mas rico de lo esperado, y que, por ejemplo, tal vez algunos fenómenos que por argumentos de “naturalidad” podrían parecer muy improbables a lo mejor no lo sean debido a que en algún punto hay alguna “sensiblidad” oculta en algún punto.

Quantum chaos: las aproximaciones habituales

marzo 21, 2013

Cuando en los 80 hubo la revolución del caos (Ian Malcom’s dixit) inmediatamente se empezó a tratar de ver si podría haber algo similar en mecánica cuántica. El caso es que si bien ha habido progreso en ese área la verdad es que no se ha obtenido nada que pueda considerarse revolucionario.

Los motivos son varios. Uno de ellos es que la gente de quantum chaos no suelen ser físicos teóricos habituados a la teoría cuántica de campos sino gente de física mas aplicada mas habituados a trabajar con la ecuación de Schröedinger que es lineal y no encaja con el paradigma del caos clásico dónde el comportamiento caótico surge de ecuaciones no lineales. En realidad en algunas áreas se trabaja con alguna variante de la ecuación de Schroedinger no lineal. Cómo podéis leer en la wiki la ecuación no lineal surge en física clásica y cuando se pasa a la versión cuántica de esa ecuación se obtiene una ecuación lineal.

No voy a extenderme mucho en lo que se ha hecho en esta línea de trabajo porque no lo conozco muy a fondo. remito a la gente a la entrada de la wiki para el punto de vista standard.

El caso es que en principio la cuántica y el caos son antagónicos. El caos esta ligado a ecuaciones no lineales y la cuántica es la teoría de operadores lineales sobre espacios de Hilbert (equipados si a alguien le importa el rigor), o espacios de Fock (productos tensoriales infinitos de espacios de Hilbert por así decirlo) si vamos a teorías de campos o quizás a construcciones con *-álgebras si se trabaja en las versiones mas rigurosas de cuantización en espacios curvos. En cualquiera de estos casos uno esta trabajando con teorías lineales. Si uno tiene una teoría clásica y la cuantiza la no linealidad de la teoría clásica se pierde y obtiene una teoría lineal. En ese sentido alguna gente se dedica a estudiar cómo la cuantización “suaviza” el caos clásico.

El caso es que uno podría plantearse si en esa linealización no pudiera perderse algo. Cojamos un ejemplo típico, y muy importante, una teoría gauge no abeliana. En esa las ecuaciones clásicas de los campos gauge son no lineales. En la interpretación habitual se considera que un campo nos da la probabilidad de crear una partícula. Para que esa interpretación de partículas tenga sentido lo que se hace es cuantizar la teoría entorno a un vacío concreto de la teoría cuántica. Si el vacío cambia (cómo pasa con el fenómeno de ruptura espontanea de simetría asociada al Higgs) la interpretación de partículas clásica, y de hecho la esencia de la física, cambia. Lo que yo no tengo claro es que la mecánica cuántica, al menos tal cómo la conocemos, sea capaz de describir esa transición entre vacíos. Bueno, sí, tenemos los instantones que pueden ser tratados por integrales de caminos pero no sé hasta que punto no omiten algún aspecto importante.

Bien, entonces, si la cuántica, al menos tal cuál la entendemos, es una teoría de operadores lineales, todo el “fenómeno caos” de evolución sensible a las condiciones iniciales debe ser olvidado ¿o no?. El punto clave es plantearse que es caos. Si uno se plantea esto cómo partir de un hamiltoniano de un sistema y considerar que la no linealidad de este hamiltoniano se traduzca en que una pequeña diferencia entre las condiciones iniciales en el tiempo de las condiciones iniciales evolucione a una gran diferencia de las condiciones finales al cabo de un lapso relativamente corto de tiempo(efecto mariposa) no creo que pueda obtenerse realmente algo así cómo un quantum chaos que sea de una importancia tan esencial cómo el caos clásico.

Pero si nos permitimos una ligera extensión del concepto de caos a algo cómo que una pequeña ignorancia experimental en el sistema pueda conducir a que la evolución temporal de ese sistema amplifique de manera no lineal esas pequeñas ignorancias cuando el sistema evoluciona entonces la historia es muy diferente. Os daría referencias sobre eso pero hasta dónde sé no hay ninguna, y espero que no las haya, al menos hasta que no escriba yo algo al respecto ;).

Multiverso y mecánica cuántica

mayo 20, 2011

Hoy ha aparecido en arxiv un artículo de dos “pesos pesados”, Leonard Suskind y Raphael Bousso sobre la relación entre las bases de la mecánica cuántica y el multiverso: The Multiverse Interpretation of Quantum Mechanics.

El abstract del artíclo es bastante auto-explicativo:

We argue that the many-worlds of quantum mechanics and the many worlds of the multiverse are the same thing, and that the multiverse is necessary to give exact operational meaning to probabilistic predictions from quantum mechanics.
Decoherence – the modern version of wave-function collapse – is subjective in that it depends on the choice of a set of unmonitored degrees of freedom, the “environment”. In fact decoherence is absent in the complete description of any region larger than the future light-cone of a measurement event. However, if one restricts to the causal diamond – the largest region that can be causally probed – then the boundary of the diamond acts as a one-way membrane and thus provides a preferred choice of environment. We argue that the global multiverse is a representation of the many-worlds (all possible decoherent causal diamond histories) in a single geometry.
We propose that it must be possible in principle to verify quantum-mechanical predictions exactly. This requires not only the existence of exact observables but two additional postulates: a single observer within the universe can access infinitely many identical experiments; and the outcome of each experiment must be completely definite. In causal diamonds with finite surface area, holographic entropy bounds imply that no exact observables exist, and both postulates fail: experiments cannot be repeated infinitely many times; and decoherence is not completely irreversible, so outcomes are not definite. We argue that our postulates can be satisfied in “hats” (supersymmetric multiverse regions with vanishing cosmological constant). We propose a complementarity principle that relates the approximate observables associated with finite causal diamonds to exact observables in the hat.
.

No es la primera vez que se ha intentado hacer algo en esta línea. Peter Woit, el autor del blog contrario a la teoría de cuerdas “not even wrong” ha puesto una entrada sobre este artículo Cosmological Interpretations of Quantum Mechanics dónde da un enlace a un artículo del año pasado. En el libro Universe o multiverse del 2003 ya se trataba este tema.

Digamos que lo importante no es que se haya tratado el asunto sino que lo hayan hecho dos físicos tan famosos como Susskind y Bousso.

La idea de este tipo de artículos es más o menos sencilla de entender. En mecánica cuántica la función de onda evoluciona de manera determinista. Sin embargo cuando “colapsa”, es decir, cuando se hace una “observación” el resultado de la medida es incierto y esta distribuido probabilisticamente entre una serie de valores posibles. Una interpretación famosa de ese hecho, distinta a la interpretación escolástica de cophenage es la interpretación de los “muchos mundos” de Everett. En esa interpretación cada vez que se hace una medida se produce un universo nuevo, uno por cada resultado posible de la medida. En las teorías modernas de inflación (la inflacion es una etapa de expansión muy acelerada del universo, requerida para conciliar algunas observaciones cosmológicas del universo en sus primeros instantes) es requerido que no haya una sino muchas, en la práctica infinitas, inflacciones Cada una de estas crearía su propio universo, y el conjunto de todos esos universos el multiverso. La tentación es obvia, unir la interpretación de Everett de la mecánica cuántica y estos modelos de “inflación eterna” o “inflación caótica” de tal modo que cada universo opcional de Everet es un universo real creado por el mecanismo de inflación.

En eete artículo usan, como paso intermedio, la interpretación de decoherencia de la mecánica cuántica. Esta consiste en eliminar los “observadores” y simplemente hablar de dos sistemas cuánticos: uno muy pequeño, con pocos grados de libertad (la partícula o átomo a estudiar) y otro grande con muchos grados de libertad (el sistema de laboratorio y el observador que lo manipula). Ahí el “colapso” de la función de onda es una mezcla (entrelazamiento) de los estados del sistema pequeño con los del sistema grande. La interpretación de decoherencia, en mi opinión es la mas “razonable”, en el sentido de menos metafísica, de las disponibles, pero tiene algunos problemas (que son expuestos en el artículo de Suskind-Bousso. Argumentan que, aparte de los problemas habituales, la deocherencia no funciona en el multiverso. No he leído aún el artículo entero, pero veo que .hacen una llamda al principio de complementariedad de agujeros negros (que dice que la interpretación cuántica del interior de un agujero negro y debe ser la misma, es decir, debe tener los mismos estados cuánticos, para observadores fuera y dentro del agujero negro).

Imagino que Lubos estará a punto de publicar algo sobre este artículo, y sabiendo su poco cario al multiverso no creo que sea una muy favorable (aunque Susskind sea uno de los físicos que mas respeta). A mi particularmente no me atraen tampoco nada este tipo de especulaciones. Leeré el artículo porque sospecho que es de lectura casi obligada y que en el futuro se citará bastante, pero a priori soy bastante escéptico sobre la idea de mezclar la inflación eterna y el multiverso (que me parecen una hipótesis razonablemente fundada, lo cuál no significa que tenga que ser cierta, por supuesto) y los problemas de la interpretación de la mecánica cuántica. En fin, dejo el link porque sé que es importante y posiblemente algunos lectores querrán explorarlo por su cuenta (es un artículo relativamente “asequible”) pero ciertamente no es el tipo de cosas que me entusiasman.

Actualización: Cómo imaginaba Lubos analiza el artículo. Y acerté, no le gusta. Eso sí, me quedé algo algo corto en mis estimaciones sobre el desagrado que le produciría porque su post empieza fuerte, compara el artículo de Susskind-Bousso con uno similar de Smolin. Para quienes no estén al tanto indicar que Lubos considera que Smolin (poseedor de un doctorado en física por Harward y profesor de física en el instituo perímeter) es un chalado incurable y con muy pocas luces. El link concreto a la entrada es este: The Bousso-Susskind hypermultiverse.

Hacia una mecánica cuántica 3.0

mayo 13, 2011

Hace poco había tenido una idea de como reformular la fenomenología en física de partículas hacia un nuevo escenario. La idea era sencilla, tomarse en serio el problema de la energía del vacío y progresar a partir de ahí. A partir de lo que conocemos el único modo medio natural de tener una constante cosmológica pequeña es que la supersimetría este casi sin romper. Se cumple la relación: \rho_\Lambda \sim M_{SUSY}^4 dónde \rho_\Lambda es la energía del vacío correspondiente a una constante cosmológica \lambda y Msusy, obiviamente, es la masa a la que se rompe la supersimetría. La idea es tomarse esto en serio y pensar que los compañeros supersimétricos tienen la masa necesaria para hacer que la constante cosmológica tenga el valor observado (o cualquier valor arbitrariamente pequeño que elijamos si no nos creemos las observaciones que señalan que vivimos en un universo en expansión acelerada discernible). Eso va en contra del uso que se le suele dar a la supersimetría, que es fijar la jerarquía de masas en el modelo standard (mediante el hecho de que estabiliza la mas del bosón de Higgs y la protege de correcciones cuánticas que harían que esta masa evolucionara hacia la masa de Planck).

Afortunadamente hay otro método de estabilizar la mas del bosón de Higgs y obtener jerarquía: los modelos tipo Randall-Sundrum con dimensiones extra de un cierto tamaño (mesoscópico). Eso nos daría algo mas de libertad para fijar la ruptura de supersimetría dónde queramos. Pero sigue habiendo problemas. El primero sería explicar como no han sido observadas esas partículas si su masa es muy pequeña. En principio eso no debería ser muy difícil de resolver. Basta con que estén en un sector oscuro y sean WIMPs. Otro problema sería ver porque la supersimetría no fija el valor del bosón de Higgs a ese valor de masa tan pequeño. Eso ya es un asunto mas delicado que no me he planteado a fondo (tal vez el higgs que da masa a la spartículas actuales fuese un KK del higgs ligero). Otro tercer problema es que debemos contar con partículas candidatas a ser materia oscura. La LSP (partícula supersimétrica mas ligera) es un buen candidato. Pero no el único. También la partícula de kaluza-klein mas ligera podría ser materia oscura. Y en el escenario R-S justo eso tendríamos, partículas KK de masa semejante a las partículas supersimétricas. Si acaso habría que vigilar que las partículas supersimétricas tan ligeras no fuesen materia oscura caliente ya que eso iría en contra de la formación de estructuras en el universo.. Quizás eso podría resolverse poniendo un grupo gauge SU(3) para el sector oscuro y un proceso de barionización oscuro. Eso nos daría núcleos de átomos oscuros que no serían tan ligeros como las partículas individuales y podrían saltarse los límites para materia caliente.

En fin, en eso estaba yo, cuando han llegado las fechas de mis exámenes de matemáticas y tuve que dejar de lado esas especulaciones. Y hete aquí que ayer en arxiv salió este artículo: Anisotropic Modulus Stabilisation: Strings at LHC Scales with Micron-sized Extra Dimensions que está analizado en el blog de Lubos: Type IIB large extra dimensions. Pues bien, en ese artículo los autores proponen un modelo en esas líneas. Eso sí, mucho mas sofisticado de lo que yo estaba intentando hacer. Yo intentaba dar un modelo básico de supersimetría + randall-Sumdrum. Ellos (M. Cicoli, C.P. Burgess y F. Quevedo)van mas allá y directamente proponen un modelo cuerdístico en toda regla.

En fin, yo sobre mi idea me había limitado a dejar caer en el facebook (si, tengo una cuenta ahí, sic) que tal vez los compañeros supersimétricos no eran lo que todo el mundo pensaba, y que no estaría mal si la presunta observacion de un “higgs-like but no Higgs” en el LHC rumoreada fuese cierta me vendría bien. Eso y comentarle a mi novia, que ahora está estudiando 4º de física teórica, mi idea general (aunque no sé yo si se habrá enterado demasiado). Total, que aunque muy probablemente no hubiese llevado muy lejos la idea es una lástima que se me hayan “adelantado” sin dejar por aquí mayor constancia. Y como hay alguna cosilla más que tengo en mente hacer no quiero que se repita. Por eso voy a hablar de una idea para reformular la mecánica cuántica.

Lo primero de todo es explicar porque digo “mecánica cuántica 3.0” y no 2.0. Realmente hubo una primera mecánica cuántica, previa a la ecuación de Schröedinger y la mecánica matricial de Heisenberg. Esa fue la mecánica cuántica de Bohr, con las condiciones de cuantización para orbitales y cosas así. Realmente ambas teorías no son equivalentes ni formalmente ni en resultados físicos así que tal vez habría que llamar a la cuántica de Schröedinger y Heiseenberg (y sucesores, eso incluye la teoría cuántica de campos) la 1.0. En ese caso yo buscaría la 2.0

Debo aclarar desde ya que no soy alguien especialmente traumatizado con la cuántica, ni estoy obsesionado con sus fundamentos y sus interpretaciones. No tengo particular interés en volver a una teoría determinista y “realista”. Tampoco me obsesiona el rigor matemático y aunque respeto los esfuerzos en ese terreno tampoco me preocupan demasiado. Mis objeciones vienen de otras consideraciones. De un lado el formalismo de la cuántica está muy inspirado en la teoría de espacios de Hilbert, o, mas bien, en la teoría de Sturn Liouville para resolver ecuaciones en derivadas parciales (los espacios de Hilbert vinieron después, con Von-Neumann). Eso hace que la cuántica este impregnada de un linealismo (pues se trabajaba con ecuaciones en derivadas parciales lineales) que no me encaja del todo con el hecho de que las ecuaciones clásicas relevantes sean no lineales. Por supuesto los motivos de la linealidad son otros, y supuestamente debe ser un principio sagrado de la mecánica cuántica, pero aún así si en algún momento pudiera ver como relajar ese principio de una manera coherente sería mas feliz.

Otro motivo para retocar la cuántica es que desde la cuántica no relativista ha habido muchas evoluciones. Primero la cuántica relativista, su ulterior evolución a la teoría cuántica de campos en espacios planos. Mas tarde la cuantización en espacios curvos y, por último, la teoría de cuerdas, que es un mundo aparte. Cada una de estas evoluciones tiene sus peculiaridades y el paso de los postulados de la cuántica relativista a los casos mas complicados es un poco un proceso de parchear el formalismo, y fijarse en otros factores. Sería interesante ver si puede construirse algo que pueda afrontar todos los casos desde una perspectiva unificada.

Otro tema, de interés tangencial, es el tratamiento asimétrico del tiempo en la cuántica. No existe algo así como un “operador tiempo”. Sobre eso estuve en el pasado haciendo consideraciones, que normalmente terminan en un dolor de cabeza, pero con todo algo saqué en claro.

Bien, voy a dejar un pequeño esquema muy provisional de como, tal vez, podría empezar a reformularse la cuántica.

Mi punto de partida es seleccionar el aspecto fundamental que caracteriza la cuántica. Creo que el mas importante es que la cuántica es probabilista. Ahí incluso me planteo la posibilidad de dar un salto conceptual, mas allá del mero formalismo. El punto de vista actual es que la evolución de la función de onda es determinista y que el aspecto probabilista surge al considerar los entes clásicos llamados observadores. Yo no voy a hacer ningún supuesto a priori respecto a esto. Voy a partir de una idea de un mundo real, cuántico/probabilista, y a raíz de ahí buscar interpretaciones de la mecánica clásica.

Mi idea seria plantearme que lo que tenemos un mundo con una serie de estados posibles y unas probabilidades de pasar de unos estados a otros. Esos estados no tendrían porque ser (mientras no se demuestre que sea obligatorio) elementos de un espacio de Hilbert. Mas bien serían un espacio de probablidad abstracto. Las “funciones de onda” serían algún tipo de matriz estocástica (al estilo de las cadenas de Markov, o, mas bien, procesos de Markov en tiempo continuo) que nos darían las probabilidades de transición de un elemento del espacio a otro.

Voy a intentar ver como encaja eso con la idea de una función de onda cuyo cuadrado es la probabilidad de hallar una partícula en una posición determinada. El punto clave es darse cuenta de que esa interpretación, en última instancia, descansa en que tenemos un conjunto de funciones, las autofunciones del operador posición. La idea es que la probablidad de encontrar la partícula en una posición x es la proyección de la función de onda (o para hablar mas propiamente, usando el formalismo de Dirac, del estado de la partícula sobre la autofunción del operador \hat{x} con valor x. En un formalismo puramente probabilista los autoestados de x serían simplemente unos estados elegidos convenientemente porque tienen una significación clásica intuitiva. Lo que nos interesaría sería la “matriz de transición” entre unos estados y otros. Ciertamente, hay un número infinito de tales estados y no hablaríamos de una “matriz de transición” sino de densidades de probabilidad, propias de la probabilidad para variables de probabilidad continuas.

Otro tema importante seria ver que pasa con la relación entre esos estados y la geometría y topologia del espacio tiempo. En principio el formalismo no debería ser muy sensible a estos aspectos. Por ejemplo, si queremos mecánica no relativista tenemos básicamente que respetar el principio de relatividad de galileo. Es decir, que las leyes físicas son iguales para observadores inerciales. Eso es un concepto puramente clásico. De forma abstracta podríamos pensar que estamos seleccionando un conjunto de estados dentro de nuestro espacio de probabilidad y exigir que las amplitudes de probabilidad de nuestra “cadena de Markov” debe estar oportunamente cocientada respecto a esos estados. Si eligiésemos relatividad especial simplemente cocientaríamos sobre otro grupo de estados.

Por supuesto la física entra en la elección de esos estados. Y entra en forma de simetrías. Eso significa que estamos introduciendo conceptos métricos y topológicos. Lo importante sería que, en principio, el formalismo cuántico sería común para la cuántica relativista y no relativista. No habría que pasar de espacios de Hilbert a espacios de Fock. Debería, por supuesto, tratarse con cuidado el tema del vacío.

Y también debería buscarse exactamente como se obtiene una ecuación dinámica que genere esas cadenas de Markov que representan la función de onda.

Obviamente todo esto son ideas muy, muy preliminares. Pero como tengo visto que la gente no se dedica a buscar ideas en blogs ajenos no me preocupa mucho dejar por aquí estos preliminares an poco concretos. Estoy convencido de que nadie va a abandonar su línea de trabajo para ponerse a desarrollar estas ideas tan vagas. Y, si luego alguien que ya estaba trabajando en ideas similares saca algo serio, y funciona, yo podre decir “hey, ¿veis como iba por buen camino?” ;).

Y eso es todo por ahora. Dada mi poca formalidad para mantener una periodicidad a la hora de poner posts no sé yo cuanto pasara hasta la próxima publicación ¡que estas últimas dos han estado muy seguidas!.

Como perder el tiempo cuanticamente

agosto 18, 2010

Hace 2 años hubo un concurso, organizado por la fundación templeton y el FQXI pidiendo artículos sobre la naturaleza del tiempo y pagando 10.000 dólares al ganador de dicho concurso. Podéis leer lo que escribí sore el particular en mi otro blog: The fqxi time essay contest.

Lo curioso del asunto es que soy mas dado a leer libros y artículos arxiv sobre hep_th (high energy physics, theory) y, si acaso sobre gr_qc (general relativity, quantum cosmology). Con esa base mi mayor contacto con las delicadezas de la física del tiempo provienen de las curvas de tiempo cerrado que parecen en relatividad general, y, mas por capricho que por otra cosa, con los taquiones.

No viendo pues grandes elucubraciones sobre el asunto no se me ocurrió otra cosa que lanzarme por mi cuenta y riesgo a especular sobre como podría ser un tiempo cuántico. Tenía algunas motivaciones razonables para ello, y el caso es que desarrollé un tanto el tema. Incluso alguna gente me dio pistas sobre algunos problemas obvios.

Cuando llegó ese concurso decidí aprovechar ese esfuerzo y presentarme. Al fin y al cabo veía que muchos de los artículos enviados, sobre todo inicialmente, eran realmente flojos. Según fui documentándome para asegurarme de que entregaba algo digno me dí cuenta de que si había gente que se dedicaba a a elucubrar sobre esos temas, la que suele publicar en arxiv quant-ph que es una zona que apenas frecuento. Una vez visto el percal me dí cuenta de que lo que hubiera podido publicar tenía todos los boletos para ser considerado “chaladura” (es decir, lanzarse a elucubrar sin haber leído lo suficiente)así que en cierto modo modo fue una suerte que por circunstancias de última hora no pudiera enviar nada. Digo “casi” porque algunos aspectos de lo que tenía pensado estaban basados en temas que si conocía, de los libros sobre agujeros de gusano, y de algunas otras cosillas de libros de gravedad cuántica y cosas de prigogyne. Digamos que comparado con la mayor parte de cosas que se enviaron hubiera sido de lo mas sensato.

Bien, no hace mucho en el blog del arxiv comentaron un artículo sobre la relación del tiempo y las geodésicas cerradas. Podéis leer la traducción en el blog de ciencia kanija: Una máquina del tiempo cuántica resuelve la paradoja del abuelo

Como podéis leer en los comentarios la gente se queja de que no entiende demasiado. Y tienen razón. El caso es que me leí el artículo original del arxiv, así como algunos de los que referenciaba. Además, curiosamente, desde entonces han aparecido algunos artículos más sobre el particular. Me llamó l atención que esos artículos no tienen en cuenta un aspecto que en su momento se me había ocurrido a mi.

Es fácil explicar por encima la idea. Esa gente propone que cuando uno sigue una curva cerrada se encuentra con un estado de superposición cuántica. No es algo muy sorprendente, es casi lo primero que uno podría intentar. Por ejemplo: En la serie “flasforward” reciente emitida en cuatro (basada en una novela del autor de CF Robert J. Sawyer) se usa la misma idea. Es llmativo que mucha de la gente que trata esos temas sean personas interesadas en computación cuántica (como el propio Sawyer). El tipo de cosas que se contemplan en ese campo son muy chocantes para alguien acostumbrado a la física de cuerdas. Por ejemplo, parece ser que una motivación para estudiar esos asuntos es la posibilidad de usar un ordenador normal para resolver de modo lento (NP, no polinomial) un problema dado (evidentemente prque no se tiene un mejor algoritmo), dejar que termine de computar la solución y cuando la tenga enviarlo en una curva de tiempo cerrada de vuelta al momento en que se puso a hacer os cálculos, con o cuál lo habrá resuelto en tiempo polinomial.

En fin, muy raro. El caso es que decía que había localizado un problema en las superposiciones de estados cuánticos. Es muy fácil de explicar. no puede viajar en el tiempo y cambiar no un estado cuántico sino el propio estado de vacío. Como los estados cuánticos son excitaciones de vacío y no pueden hacerse superposiciones entre estados correspondientes a vacíos distintos (regla de superselección) no pueden resolverse todas ls paradojas temporales por esos métodos.

El caso es que seguir el quant_ph para ponerse al día en esos temas es un lío. Y ni siquiera creo que me interese lo suficiente. Pero como uno tiene curiosidad (la que ya se sabe mató a gato de Schröedinger) busca soluciones menos complicadas. Y he encontrado un libro entero sobre el tiempo cuántico: Time in quantum mechanics.

Como tiene buena pinta tengo intención de irlo ojeando (y comparando lo que viene con mis ideas de antaño) Eso sí, cuando tenga tiempo para ello, tiempo cuántico, of course 😉

Introducción a la mecánica cuántica

mayo 8, 2008

ES común en los libros de bachillerato incluir una introducción a la mecánica cuántica dentro de su sección de física moderna. Cómo sé que mucha gente esta ahora a punto de empezar a preparar la selectividad y les entra en el temario, voy a hacer una presentación del tema. Conociendo los libros y cómo tratan la materia voy a intentar que el post complemente en parte esos libros, aunque, no por ello, deja de ser este post una presentacion autocontenida. Empiezo por presentar algunos conceptos matemáticos necesarios para un correcto entendimiento de la cuántica. Manejar bien esos conceptos, tener soltura con los cálculos, requiere una formación extensa, pero los conceptos en sí no son muy dificiles de entender.

Concepto de ecuación diferencial:

Los planes de enseñanza contemplan que todo el mundo sepa que es una ecuación algebraica.

Esto es una expresión que puede ser algo tan sencillo como lo siguiente:

2x + 1 = 0.

Todo el mundo sabe resolver esto. 2x= -1 => x= -1/2.

Bien, en física muchas de las leyes no se expresan por ecuaciones (o expresiones) algebraicas. Lo normal es que se expresen por ecuaciones difererenciales.

La mas famosa de ellas es la segunda ley de Newton F=m.a. En la fisica de bachillerato se empieza explicando cinemática y se habla del movimiento uniformemente acelerado, con lo cuál a es constante. Si a priori sabemos que el ejercicio va describir un movimiento unifromemente acelerado la segunda ley de Newton puede tratarse cóm una ecuación algebraica, pero ese planteamiento puede llevar a ocultar un poco su verdadera naturaleza como ecuacion diferencial. La forma correcta de expresar esta ley es:

F=m.d^2S(t)/t^2 (S(t) es la posicion de la partícula en el instante t)

F en general dependerá a su vez de S, y posiblemente de t. Si el problema es en una dimensión podemos usar la coordenada x en lugar de S.

Cojamos un caso típico, el oscilador armónico. aquí F= k.x. (k es la costante recuperadora del muelle y es normalmente algo que se conoce, no una incógnita). Así la ecuación queda :

k.x(t)= m. d^2x(t)/dt^2

Quiere esto indicar que x indica la posición de la partícula y esta partícula se va desplazando en el tiempo.

Si pasamos el lado derecho de la expresion anterior restando al lado izquierdo resulta:

m. d^2x(t)/dt^2 - k.x(t)=0 .

Esto se parece bastante a las ecuaciones algebraicas del principio. La diferencia es que allí x representaba un valor que debíamos determinar. Aqui representa una funcion de t que debemos determinar. Otra diferencia básica es que allí x aparecía multiplicada por números, aquí ademas aparece derivada.

Voy a recalcar el , muy relevante, hecho de que la función a determinar, x(t), o sus derivadas, no aparecen elevadas al cuadrado o potencias superiores. Es una ecuación diferencial lineal. Aunque en físia hay ecuaciones diferenciales no lineales (por ejemplo en dinámica de fluidos) hay mucha física que se puede describir mediante ecuaciones lineales. Tampoco he mencionado otro hecho que no viene mal conocer. El orden de una ecuación diferencial hace referencia a la máxima derivada que aparece. Aquí la función como máximo aparece derivada dos veces. Por tanto es una ecuación lineal de segundo orden.
Es más, como no hay nada que dependa de la variable independiente, t, si agrupo las expresiones que incluyen la función incógnita y/o sus derviadas ya la izquierda el resto de expresiones resulta que a la derecha no hay nada. Es una ecuación diferencial lineal de segundo orden homogénea. No haré mas hincapien en la clasificación de las ecuaciones diferenciales, de momento.

¿Como se resuelven ecuaciones diferenciales? En la universidad hay asignaturas anuales para enseñarte a resolver una serie de ecuaciones diferenciales lineales básicas. Aquí me limitaré a exponer como resolver esta.

Para ello recordar que si x(t) = sen w.t su derivada es x'(t)= w. cos w.t

Y que la derivada de x(t) = cos w.t es , introduciendo otra notación también habitual y conocida, (cos wt)’ = -w.sen wt.

Esto es muy interesante, implica que (sen w.t)”= -w2 sen wt.

Es decir, la derivada segunda de la función seno es ella misma, multiplicada por un factor. Mirando atentamente nuestra ecuación uno se da cuenta de que una función seno esla candidata ideal para ser nuestra solución. Nos faltaría saber cuál es w.

Si aplicamos lo visto nuestra ecuación queda:

-w2.m.sen(wt) – k sen(wt) =0

Sacando factor común queda: [-w2.m – k].sen(wt)=0

Pero sen(wt) en general no es 0 para un valor arbitrario de t. La única posibilidad es que lo que lo multiplica sea 0.

Es decir -w2.m – k=0

Esto es una ecuación algebraica para w. Sabemos resolverla. w= (k/m)1/2. En realidad podríamos pensar que el mismo valor con un signo menos valdría.

Incidentalmente resulta que esta w es la frecuencia de oscilación del muelle. Con lo cuál recuperamos la información que se suele obtener en la física de secundaria. De hecho esta observación sirve para descartar la otra posibilidad que se nos presentaba, haber elegido la solución para w con valor negativo.

He calculado una solución. En realidad hay dos soluciones linealmente independientes. Y cualquier combinación lineal de ellas es solución. En el oscilador armónico la otra solución sería cos wt, dónde w tendría le mismo valor de antes.

En general una ecuación diferencial admite muchas soluciones. Pero si se complementa la ecuación con información adicional, en el ejemplo aquí tratado sería la posición y la velocidad del extremo del muelle en un instante dado, la solució que cumpla esas condiciones adicionales es única.

Concepto de derivada parcial:
Recordemos que es una derivada parcial. El concepto surge cuando se tiene una función de varias variables, por ejemplo:

f(x,y,z)= sin x + x.y.z2.

Por ejemplo f podría representar la temperatura del gas en una habitación. Cada punto de la habitación correspondería a un valor concreto de las variables x,y,z y tendría una temperatura indicada por el valor de f en ese punto.

Entonces la idea es que se puede tomar la derivada con respecto a cada una de las variables y que el resto se traten como constantes.

Así por ejemplo quedaría:

∂f(x,y,z)/∂x= cos x + y.z2.

Nótese que aquí la derivación se indica con ∂/∂x en lugar de con d/dx. Normalmente se sigue usando esta notación hasta cuarto de carrera. Una vez allí, que la gente ya se ha familiarizado, se cambia por una notación abreviada, que es la que usaré en adelante. Se substituye ∂/∂x por ∂x. Evidentemente \partial ^n x significa la derivada enésima respecto a x. (derivar n veces respecto a x).

Por supuesto se pueden hacer derivadas cruzadas, por ejemplo:

∂xy f = z2.

Se puede demostrar que si f cumple condiciones razonables se cumple que ∂xy=∂yx (derivar primero con respecto a x y luego respecto a y es lo mismo que hacerlo en el orden inverso)

Ecuaciones en derivadas parciales:

Una vez explicado que es una derivada parcial es sencillo entender que es una ecuación en derivadas parciales. Una identidad en la que se igualan diversas derivas parciales de una función de varias vaariables que será nuestra incógnita. Por ejemplo:

∂xx f(x,y) + ∂yy f(x,y) =0

Es decir debemos encontrar una función de dos variables cuya derivada segunda respecto a x sumada a su derivada segunda respecto a y sea igual a 0. Normalmente no se indica el número de variables de los que depende f, pues suele poderse averiguar fácilmente por la misma forma de la ecuación.

Antes de pasar a las técnicas de solución debemos detenernos en un aspecto importante. Las condiciones iniciales.

En una ecuación diferencial ordinaria, en que la funcion sólo depende de una variable, vimos antes que hay varias soluciones posibles a la ecuación, pero si especificamos el valor de la función, y el de su derviada, para una x0 dada, es decir f(x0)=C0, f'(x0)= C2,

En el caso de las ecuaciones de movimiento debíamos fijar la posición y la velocidad en un instante dado de tiempo para fijar una solución única. Esto es el llamado teorema de existencia y unicidad. Esta probado para ecuaciones tanto lineales como no lineales.

Las ecuaciones en derivadas parciales (a partir de ahora EDP’s) son mas complicadas, se clasifican en parabólicas, hiperbólicas y elípticas. Cada tipo requiere un tipo especial de condiciones de frontera (que ya no iniciales).

No discutiré todos los casos. Sólo uno, muy importante para la mecánica cuántica. La ecuación de onda (que es de tipo hiperbólico), nos centraremos en el caso mas sencillo, la unidimensional:

1) ∂xxΨ -1/c2∂ttΨ=0

(denoto la función incógnita por Ψ, que es una notación standard para la función de onda en mecánica cuántica)

No analizaré la teoría general (no es muy necesario para nuestros propósitos). Analicémoslo desde un punto de vista intuitivo y físico.

Esta ecuación podría representar en mecánica clásica una cuerda vibrando. La cuerda estaría extendida en el eje de las x y las vibraciones podrían se en el eje de las y. En ese caso Ψ denotaría la amplitud de la vibración en la coordenada Y en el punto x de la cuerda.

¿Que condiciones sería normal imponer? Físicamente una situación común sería que la cuerda estuviera sujeta en ambos extremos, que serían x=0 y x=L (L= longitud de la cuerda). Esto matemáticamente se expresa por:

Ψ(0,t)=Ψ(L,t)=0 (para todo valor de t, normalmente eso se indica con una A invertida, pero no encuentro como representar ese símbolo en HTML)

Estas son condiciones en el extremo de la cuerda. En un caso mas general serían condiciones en el contorno de un recinto. Por eso en EDP’s es común hablar de condiciones de contorno.

¿Que mas podemos necesitar? No he explicado de dónde sale esta ecuación. Se puede deducir de las ecuaciones de Newton. Se parte de una situación con muchas partículas en el eje x y se hace el paso al límite en que en cada posición del eje hay una partícula. Es el paso al continuo, y lo que se llama mecánica de medios continuos.

Al venir de las leyes de Newton sabemos que necesitamos conocer la posición y la velocidad de cada punto de la cuerda en un instante, por ejemplo para t=0

Ψ(x,0)=f(x), ∂xΨ(x,0)=g(x), dónde f y g son dos funciones que podemos tomar arbitrariamente (salvo las restricciones habituales de que no sean demasiado patológicas, no entraré en detalles por ahora).

Bueno, esta es una selección posible de condiciones iniciales y de contorno para este problema. Hay mas posibilidades, pero esta es la mas sencilla.

Dije que esto estaba relacionado con la mecánica cuántica. En realidad el mismo problema matemático podría representar una partícula cuántica atrapada en un “pozo infinito”, es decir, una región de la cuál una partícula cuántica no puede salir.

Hay algunas diferencias. Voy a exponer aquí algunos postulados de la mecánica cuántica, sin explicar mucho de dónde surgen y luego pasaré a analizar como resolver el problema matemático planteado.

Primer contacto con la mecánica cuántica

¿Que representa Ψ en mecánica cuántica?

La probabilidad de que la partícula este en la posición x.

Para una partícula cuántica no se puede determinar a la vez la posición y la velocidad con precisión absoluta.. Este es el famoso principio de incertidumbre de Heisenberg. Se cumple que:

2)ΔX.ΔP=h/2π

(ΔX es la indeterminación en la posición, ΔP es la indeterminación en el momento, el momento es el producto de la masa por la velocidad, h es la constante de planck)

Una consecuencia del principio de incertidumbre es que ya no se puede hablar de que una partícula siga una trayectoria. Toda la información sobre un sistema cuántico (la posición más probable, la velocidad mas probable, la energía, etc) la debemos obtener a partir de su función de onda, que lo describe completamente.

¿Como obtenemos esa información?

Mediante unos objetos matemáticos llamados operadores. la posición nos la dará el operador posición, la velocidad (o equivalentemente el momento) el operador momento, la energía el ¿operador energía?, no , el Hamiltoniano, ya veremos que es y de dónde surge.

Para poder avanzar vamos a ver que forma puede tomar una función de onda. Su nombre indica que debe cumplir una ecuación de onda.

Si sustituimos en la ecuación 1) veremos que Ψ(x,t)= sen (kx – ct) cumple la ecuación (sin ocuparnos de las condiciones de contorno). La ausencia de condiciones de contorno significa que la onda/partícula puede ir a cualquier lado.

Esto representa en el caso clásico una ondulación de la cuerda avanzando en la dirección positiva del eje x a una velocidad c.

Se podría usar esta función, no obstante es mas común usar la exponencial compleja.

3) Ψ(x,t)= exp {i(kx – wt)}=cos(kx -wt) + i.sen(kx -wt)

La última igualdad proviene de de la forma polar de escribir un número complejo. Asumiré que el lector esta familiarizado con los números complejos.

¿Por qué trabajar con funciones de onda compleja?. En realidad no es imprescindible. Pero facilita mucho el formalismo. Así que normalmente en los cursos de mecánica cuántica se postula que estamos en un espacio de Hilbert complejo de las funciones L2 de cuadrado integrable y no se dan demasiadas explicaciones.

Al fin y al cabo ya se supone al estudiante familiarizado con espacios de Hilbert. De momento no he dicho que es un espacio de Hilbert. Ya veremos su origen cuando resolvamos la ecuación de ondas, mas adelante. Pero por el momento no necesitamos saber que es.

Hasta ahora he saltado a hablar de función de onda sin dar muchas explicaciones de porque se hace esto. Después de todo en mecánica clásica describíamos una partícula por la evolución su posición en el tiempo, su trayectoria.

Ya se dijo al hablar del principio de incertidumbre que eso no es posible. Pero el motivo histórico por el que se introdujo la función de onda es otro. Proviene de una vieja discusión sobre la luz. La luz ¿es una onda o es una partícula?

Newton afirmaba que era una partícula. Que la luz que veíamos estaba hecha de muchas partículas.

Sin embargo por esa misma época huygens hizo una serie de experimentos que indicaban que la luz tenía un comportamiento ondulatorio. En el siglo XIX James Clark Maxwel resumió todo lo que se había averiguado hasta ese momento sobre electromagnetismo en cuatro ecuaciones.

De esas cuatro ecuaciones podía deducirse que en ausencia de cargas también podía haber campo electromagnético. Ese campo electromagnético seguía una ecuación de ondas (vectorial). Las ondas de una cierta frecuencia eran la luz visible. Otras longitudes de onda se usan hoy para la radio, los teléfonos móviles. También aparecen de manera natural en elementos radiactivos, los rayos x, los rayos gamma, etc.

Eso parecía zanjar la cuestión. Sin embargo unos experimentos muy a finales del XIX y a principios del siglo XX volvieron a sembrar la duda. En concreto el efecto fotoeléctrico y el efecto compton.

El efecto fotoeléctrico es una discrepancia entre la energía que adquieren los electrones que escapan de una lámina de metal bajo la iluminación de ondas electromagnéticas.

Según la teoría clásica la energía que adquirían estos electrones dependía de la intensidad de la luz. Pero en realidad se observaba que no era así. Su energía dependía de la longitud de la onda.
Einstein interpretó esto introduciendo el concepto de fotón. Decía que la luz estaba formada por corpúsculos. Para explicar el efecto Einstein asignó a estos corpúsculos, que denominó fotones, una energía:

4) E = hv (dónde v es la frecuencia de la radiación y h, de nuevo, la constante de planck)

Por esta explicación es por la que Einstein recibió el premio nobel de física, y no por la teoría de la relatividad, como usualmente se cree.

El efecto compton consiste en que si la longitud de los fotones incidentes es aún mas alta pueden chocar con los electrones y cambiar su frecuencia.

Esto se explica asignado al fotón no sólo energía sino cantidad de movimiento, o momento, en concreto:

5) p= hv/c

Así que los fotones tienen un claro comportamiento como partículas. Pero según Maxwell también quedan bien descritas muchas de sus propiedades mediante una ecuación de ondas.

Mas adelante otros experimentos demostraron que en ciertas circunstancias los electrones, que claramente parecían partículas, podían comportarse como ondas. Se les asigno una longitud de onda, la longitud de onda de deBroglie:

6) λ =h/p

Y de ahí se llegó a describir las partículas mediante una función de onda que indica la probabilidad de hallar la partícula en un punto.

Hemos hecho un largo desvío en nuestro propósito de ver como obtener información de la función de onda. No ha sido en vano, ahora veremos por qué.

Recordemos la ecuación 3. Esta describe una partícula desplazándose libremente con velocidad v=k/m (m la masa de la partícula) y frecuencia w. Si la partícula no se desplazar libremente la ecuación que regiría su movimiento sería diferente.

Normalmente habría un término que indicaría que esta sometida a un potencial. O también se puede caracterizar cierto tipo de potenciale por condiciones de contorno. Por ejemplo el “pozo infinito” es un potencial cuyo valor es muy alto, idealmente infinito, en todo el espacio, excepto en una región determinada. De momento vamos a seguir trabajando con la partícula libre.

Hemos de suponer que representa una partícula con momento k. ¿que operador sería adecuado para esto?

Bien, sería:

P x= -ih/2m . ∂x

Es decir, el operador momento (para ser exacto su componente x) consiste en derivar la función de onda respecto a x y multiplicar el resultado por -ih/2m.

Se puede verificar que si hacemos eso sobre la función de onda 3 obtenemos que:

P x Ψ= k. Ψ

Es decir que el resultado de actuar con el operador momento sobre la función de onda es equivalente a multiplicar esta por k. Normalmente en mecánica cuántica un operador se indica poniendo un ^ sobre la letra. Sin embargo por simplicidad de escritura me limito a denotar los operadores poniéndolos en negrita (cuando necesito distingirlos de su contrapaartida clásica porque no quede claro por el contexto cuando hablo de unos u otros).

Esto se cumple sólo para funciones de onda de una forma particular. Las funciones que cumplen esto se denominan autofunciones del operador momento. Son las que tiene un momento bien definido.

Si elogiáramos al azar una forma para la función de onda, por poner un ejemplo 1/x2 + 1 veríamos que el resultado de actuar sobre ella el operador momento nos daría una nueva función que no es equivalente a multiplicar la función original por un número.

Esto significa que no tienen un valor definido del momento.

Para que quede mas claro. Si sabemos que un estado cuántico va a estar descrito por una función de onda que es autofunción del operador momento eso significará que si hacemos un experimento para medir este momento nos dará siempre el mismo

Sin embargo si disponemos un sistema cuántico en una situación que se describe por una función que no es autofunción del momento y medimos experimentalmente este momento obtendremos que unas veces se observa que unas veces tiene un momento y otras algún otro omento distinto (los valores obtenidos dependería de la función que hubiéramos elegido).

Si repetimos muchas veces esos experimentos incluso veríamos que a cada uno de los momentos posibles le corresponde una probabilidad de que al hacer la medida se obtenga ese valor. Por todo esto decimos que esa función, que no es autofunción, no tiene un valor bien definido del momento.

Vale, ya tenemos el operador momento. ¿que hay del operador que nos da la posición de la partícula?

Recordemos que interpretamos la función de onda como indicadora de la probabilidad de hallar una partícula en un punto.

Una propiedad de la ecuación de ondas es que se trata de u na ecuación lineal. Esto implica que si Ψ es solución y φ es solución su suma también es solución (ejercicio, demostrarlo).

Recuerdese que en cierto sentido la integral es una suma. Así podemos hacer una “suma” de un infinito continuo de soluciones de la ecuación de onda libre. Cada solución viene indicada por un valor de k. Como estamos trabajando en un instante de tiempo fijado nos desentendemos de la parte temporal de la función de ondas.

Consideremos en concreto:

7) Ψ(x,0)=1/2π .∫dk f(k).eikr

Dónde f(k)= c.e^{ -a^2/2(k-k0)^2}

Esto es un “paquete gaussiano”.

Va a representar un paquete de ondas centrado en cero y con una anchura |x|< a

¿Como sabemos esto? Habíamos dicho que la función de onda representaba la probabilidad de hallar la partícula en un punto x. Pero no habíamos dado una expresión matemática. Esta representación matemática es:

Probabilidad de hallar la partícula (para t=0) en x= |\Psi(x,0)|^2 .

Aplicada al paquete de ondas 7 nos daría:
|\Psi(x,0)|2= |c|^ 2 /a^ 2. e ^{-x2/a2} .

que es una función gausiana centrada en 0 de anchura a. de los cursos de probabilidad sabemos de sobra la forma de esta función. Si no es el caso puede representarse gráficamente y comprobarse que su dibujo claramente indica lo que afirmamos.

La interpretación probabilística de la mecánica cuántica nos dice no sólo que la función de onda hace lo que ya hemos dicho. También afirma que el valor medio de un operador debe obtenerse considerando la función de onda como distribución de probabilidad.

Es decir, que el valor medio de un operador op es ∫dx Ψ*opΨ.

Queremos que el operador posición (su componente x) X de sobre ese paquete de ondas un valor medio 0. Es sencillo comprobar que si ponemos:

XΨ= x.Ψ

(Es decir el operador x actúa sobre la función Ψ multiplicándola por x) obtenemos lo deseado.

Ya sólo nos faltaría hablar del operador hamiltoniano. Este operador representará la energía del sistema. Podies leer detalles sobre el hamiltoniano, y el lagrangiano, en los posts anteriores. Si no os apetece simplemente señarlar que en lo scasos sencillos el hamiltoniano clásico es la energia del sistema, y en muchas ocasiones tendrá la forma sencilla H= T + V. Aquí T es la energía cinética T=1/2 mv^2 , que usando la conocida expresion para le momento p=m.v puede ponerse T=p^2/2m y V es la energía potencial. Pués bien, la idea es escribir el hamiltoniano clásico y sustituir el momento clásico por el operador momento y la posición clásica por el operador posición. Eso nos lleva a la ecuacion de Schröedinger dependiente del tiempo:

Sin embargo en muchas de sus aplicaciones basta con ocuparnos de estados estacionarios, que no evolucionan en el tiempo más que cambiando su fase de manera trivial (multiplicando por una exponencial). Esos estados cumplen la ec. de Schröedinger dependiente del tiempo:

Para un caso típico la forma explicita de la ecuación, una vez sustituido en el hamiltoniano la expresion de los operadores sería:

i\hbar\frac{\partial\Psi}{\partial t} = \frac{\hbar^{2}}{2m}\frac{\partial^{2}\Psi}{\partial x^{2}} + V\Psi

Aahora tocaría ver como se obtiene la solución general de una ecuación en derivadas parciales. Eso nos permitirá entender mejor de dónde sale el considerar que la funcion de onda pertenece a un espacio de hilbert, y entender de dónde saldrán algunos postulados mas de la mecánica cuántica. Pero creo que, con todo, hayan quedado claros aalgunos conceptos básicos de la mecáncia cuántica .