Archive for 24 abril 2010

El camino de la teoría al descubrimiento experimental

abril 24, 2010

Actualmente, en especial debido a la teoría de cuerdas, se acusa a la física actual de ser excesivamente teórica. Pero no se restringe esa crítica a las cuerdas. Agujeros de gusano, multiversos, e incluso materia oscura y energía oscura están igualmente mal vistas.

Cito literalmente un ejemplo de esas críticas: Muy bonitas teorías, sujetas de un entramado matemático complejo y elegante, pero nadie ha visto un agujero de gusano y quizás jamás los vean..Ese es mi punto: teoría si práctica es pura especulación

Si miramos un poco la historia de como se han hecho los grandes avances en el siglo XX veremos que esa critica no se sostiene demasiado. Usaré ejemplos muy conocidos, que involucran a algunos de los físicos mas grandes del siglo XX, para ilustrar a que me refiero.

Empiezo por la teoría de Dirac del electrón. Se necesitaba una ecuación cuántica, análoga a la ecuación de Schröedinger, compatible con la relatividad y que describiera partículas de spin 1/2. En 1928 Dirac da con esa ecuación. Una consecuencia de la misma es que deben existir antipartículas del electrón. Esas antipartículas serían iguales al electrón en todo, excepto en la carga, que tendría el signo opuesto. Y tendrían una terrible tendencia a juntarse con un electrón para desaparecer ambas y dar lugar a un fotón gamma muy energético. Pues bien, una vez avisados de lo que debían buscar la gente que hacía experimentos con rayos cósmicos dieron con el positrón de marras ese 4 años después y Dirac se llevó el nobel al año siguiente. Posiblemente el positrón se hubiese descubierto igualmente tarde o temprano, pero seguramente hubiese tardado bastante mas en darse con él.

Otro trabajo teórico de Dirac, también muy conocido, es el de os monopolos magnéticos. Le llevó a estudiarlos su querencia a la matemática elegante. Le parecía que las ecuaciones de Maxwell carecían de simetría al no permitir monopolos magnéticos y estudió como modificarlas para que los permitiesen. El resultado no era del todo satisfactorio pues requería una “cuerda de dirac” (nada que ver con la actual teoría de cuerdas) y nunca se tomó muy en serio. En los finales de los 70 y principios de los 80 los monopolos resurgieron, en una forma ligeramente distinta, dentro de las teorías de unificación. Eran una consecuencia ineludible de las mismas y se los buscó experimentalmente, sin éxito (salvo un falso positivo que dió un golpe muy fuerte a la carrera del presunto “descubridor”). De todos modos la no detección de los mismos es un problema muy serio pues su presencia se considera ineludible y hay que explicarla. Una de las ventajas de la inflacción es que proporcionaría un mecanismo para diluir los monopolos formados en el universo primitivo y justificaría la ausencia de detección experimental.

En definitiva, aunque los monopolos están sólo en las ecuaciones hay que tenerlos en cuenta en escenarios cosmológicos. Una teoría que no de cuenta de ese problema (de uno u otro modo) no se considera una teoría cosmológica válida. En algún mmento del futuro los aceleradores de partículas se supone que deberán producir monopolos (al menos si son ciertos los modelos convencionales de unificación de las fuerzas, que, aclaro, son independientes, de la teoría de cuerdas aunque no incompatibles con ella).

Otro aso señero es el neutrino. Su existencia fue postulada en 1930 por Pauli para explicar algunos aspectos de la desintegración nuclear. Refinamientos teóricos de la propuesta inicial indicaron que el neutrino debería tener masa nula o casi nula, spin 1/2 e interactuar solo por interacción nuclear débil. Con esas cualidades era prácticamente una partícula fantasma cuya única justificación era preservar la energía en cierto tipo de desintegraciones. Muy posiblemente mucha gente preferiría teorías alterativas que no implicasen un ente tan intangible.

El caso es que estando postulada su presencia, por alguien tan importante como Pauli (secundado por alguien igualmente importantísimo, Fermi) se trabajó en su búsqueda. EN 1956, 36 años mas tarde de ser postulado, el neutrino es encontrado en un laboratorio situado al lado de una central nuclear (el reactor de fisión es una fuente al por mayor de neutrinos). Es intersante hacer notar que en el momento de crearse la teoría tanto la bomba atómica como las centrales nucleares no existían y posiblemente ni se había concebido su existencia. De no haberse postulado su existencia es casi seguro que a día de hoy siguiera sin tenerse noticia del neutrino.

Esos 36 años de lapso entre el postulado teórico del neutrino y su descubrimiento no son una excepción. La relatividad general predice la existencia de las ondas gravitatorias. Su existencia surge de una linealización de las ecuaciones de Einstein y apareció en en los primeros tiempos de la relatividad general, allá por 1915.

Teóricamente su justificación es muy firme. Pero son elusivas de hallar en la práctica. La primera evidencia experimental de las mismas debió esperar a 1974 cuando Russell Alan Hulse y Joseph Hooton Taylor Jr. descubrieron el primer púlsar binario (PSR1913+16). Las observaciones durante varios años han confirmado que el período de rotación de ambos objetos aumenta con el tiempo de la manera predicha por la teoría de la relatividad general, perdiendo energía en forma de ondas gravitacionales. Aunque estas ondas no han sido detectadas de forma directa, Taylor y Hulse demostraron que la rotación del sistema binario se aceleraba a medida que las estrellas giraban en espiral cada vez más juntas, exactamente tal y como se predecía si estuviera emitiendo energía en forma de ondas gravitacionales. Los autores de ese estudio fueron recompensados con un nobel en 1993.

Aparte de esas evidencias experimentales indirectas se ha invertido mucho esfuerzo en una detección directa, hasta ahora sin éxito. Aparte de la utilidad teórica de demostrar un aspecto básico de la RG hay un interés práctico. Muchos fenómenos de un gran interés fundamental en astrofísica y cosmología como:

-La explosión de una supernova.
-La formación de un agujero negro.
-El choque de cuerpos masivos como estrellas de neutrones o la coalescencia de agujeros negros.
-La rotación de una estrella de neutrones inhomogénea.
-Radiación gravitacional remanente del Big Bang. Este último caso ofrecería datos únicos sobre la formación del Universo en el periodo anterior a la edad oscura del Universo en la que el Universo era opaco a la radiación electromagnética.
– las cuerdas cósmicas, objetos cuya existencia postulan diversas teorías pero de las que aún no hay evidencia.

serían fuentes de ondas gravitacionales. Si pudieran detectarse podría obtenerse información directa sobre estos fenómenos no accesible, en algunos de los casos, por otros medios. El estudio de estos objetos por ondas gravitatorios posiblemente revolucionaria el conocimiento actual del universo.

La RG tiene otros aspectos teóricos con un status prominente en su marco teórico que tampoco han sido verificados experimentalmente. Entre estos estaría el “frame dragging” 8arrastre del marco). La idea es que un cuerpo al girar arrastraría consigo el espacitiempo de su entorno. El caso mas espectacular de este efecto es la ergosfera de un agujero negro rotatorio, descrito por la métrica de Kerr. Esta ergosfera sería una zona situada en la vecindad del horizonte de sucesos en la que el arrastre del agujero negro sería tan fuerte que nada, ni siquiera la luz, podría permanecer estático (respecto a un observador alejado del agujero negro). La tierra el sol también ejercerían, de forma mucho mas débil, ese efecto. Y en teoría debería ser observable. Pero al igual que las ondas gravitatorias es un efecto muy débil y pese a los esfuerzos realizados (usando satélites equipados con giroscopios adecuados al efecto) aún no hay una constatación experimental firme (ni se la espera para los próximos años).

Como puede verse no es la excepción sino mas bien la regla que las teorías hagan predicciones difíciles de verificar con carácter inmediato. Lo importante es que si esas teorías tienen una base sólida es procedente invertir en tratar de verificar esas observaciones, incluso si se tarda bastante en obtener resultados. Normalmente las teorías no predicen un sólo resultado sino varios. Y para cada resultado hay varias formas de intentar dar con su confirmación experimental.

La clave es que esos resultados teóricos sirven de guía para que los experimentadores sepan que deben buscar y diseñen aparatos para dar con ello. Sin el trabajo teórico los experimentadores estarían ciegos y encontrarían muchísimas menos cosas. Cierto es que a veces hay sorpresas y se encuentran cosas inesperadas para las que luego hay que buscar explicación. ese es otro de los caminos por los que avanza la ciencia: Pero en general el avance surge primero de la teoría y la experimentación va detrás.

Visto este proceder habitual de la ciencia la investigación teórica en agujeros de gusano no es algo tan arcano como pueda parecer. En realidad sigue el camino normal de la ciencia.Se tiene un objeto bien descrito por teorías existentes con propiedades claramente delimitadas y en consecuencia medios para, en el futuro, intentar encontrarlos (si existen en la naturaleza9 o crearlos artificialmente.

Un ejemplo menos esotérico que los agujeros de gusano es la materia oscura, cuya existencia se postuló hace ya tiempo y para la que hay muy diversos modelos y experimentos en marcha para dar con ella. Ya hablé del tema en un reciente post sobre la materia oscura (y en el futuro añadiré mas información sobre el asunto).

Otros ejemplos insignes de predicciones teóricas, aún sin verificar, serían e bosón de Higgs. Esta famosa partícula, postulada en los 70, es una pieza totalmente esencial del modelo standard , y aún hoy está sin descubrir. Se espera que el LHC (y en menor medida el Tevatroon) puedan probar su existencia en el plazo de unos pocos años. Otro objetivo del LHC es encontrar partículas supersimétricas (si es que no se encuentran antes en los experimentos de búsqueda de materia oscura). La supersimetría (puede verse una introducción al tema en mi otro blog, concretamente aquí) es una de las bases teóricas de la mayoría de desarrollos conceptuales en física e´rica en los últimos 40 años y eso pese a no haber sido descubierta experimentalmente. Pero como se ha visto en los ejemplos anteriores sigue “en plazo” y no hay buenos motivos para dejarla de lado, mas bien al contrario.

En definitiva, creo que con estos ejemplos queda claro que normalmente la ciencia siempre avanza basándose en teorías que empiezan como constructos matemáticos que, sólo mas tarde son verificados. Por supuesto si en algún momento hay observaciones experimentales que contradigan esas teorías matemáticas estas quedan refutadas, pero eso es una obviedad que no empaña la validez del esquema de trabajo explicado aquí.

Anuncios

SDO, nuevo observatario de observación solar

abril 22, 2010

i ankale (sol en lengua élfica)

El 11 de febrero de 2010 la NASA lanzó el satélite SDO (solar dynamics observatory). Este satélite esta equipado para obtener información diversa sobre el sol y darnos un conocimiento sin precedentes acerca de su funcionamiento. La propaganda proclama que es el equivalente al hubble de la física solar. La web de la NASA dedicada al satélite es esta. Hoy ha efectuado su “primer vuelo” y han llegado las primeras imágenes. Por ese motivo la NASA ha sacado un anuncio en esta página.También ha habilitado esta otra web dónde pueden descargarse vídeos sobre diferentes aspectos relacionados con la misión de la nave.

Realmente es bueno que se investigue a fondo el sol ya que difícilmente se puede sobrestimar la importancia del mismo para lo que sucede en la tierra. Por ejemplo hace poco ha salido de un mínimo de actividad de alrededor de dos años, uno de los mas largos de los que se tiene registro histórico.

De hecho en su momento se dio un aviso de que el final de ese ciclo podría llegar, durante el 2012 (para delicia de los magufos amigos del fin del mundo mya) a causar una gran tormenta solar similar a la de 1849. En esa época afectó a los postes del entonces recién inventado telégrafo. De producirse algo así hoy día pondría en un serio compromiso todo el sistema de telecomunicaciones (y en general la tecnología electrónica) provocando un caos bastante considerable (mayor que del volcán islandés ese de nombre impronunciable que ha paralizado el tráfico aéreo unos días, si es que ha terminado del todo ea amenaza, vaya) .

El caso es que si bien se tiene una idea bastante buena de muchos aspectos de la física solar faltan muchos aspectos por conocerse y es mas que bienvenido este satélite y lo que pueda aportar.

Como complemento de esta entrada dejo una introducción muy elemental a los aspectos mas sencillos de la física solar (no soy astrofísico y no conozco el tema en profundidad así que no podría entran en detalles finos aunque quisiera). Están extraídos del libro de divulgación de Jayant Narlikar “la estructura del universo”. El libro está algo anticuado pero con todo incluso hoy es una lectura interesante. A diferencia de una serie de libros actuales de divulgación (no todos) no está escrito pensando que el lector es idiota y no se priva de escribir unas cuantas ecuaciones comprensibles por cualquiera con una base matemática de secundaria (en algunos puntos sería conveniente un primero de carrera) para complementar la información puramente textual (que también es excelente).

Introducción

Aparte de las explicaciones mitológicas el entendimiento de como funciona el Sol no es nada sencillo.

No tengo constancia, pero imagino que los antiguos podrían pensar que se trataba de algún tipo de inmensa hoguera. Tampoco tengo claro cuando se habrá caido en la cuenta de que el resto de estrellas tienen la misma naturaleza que el sol, pero que simplemente estan más lejanas.

Tal vez la cosa hubiera sido diferente de estar la tierra ubicada en un sistema solar habitual. Me explico. La mayoría de los sistemas solares son binarios, o inluso ternarios, es decir, consisten de más de una estrella orbitando una muy próxima a la otra. Creo que aún no se ha descubierto observasionalmente ninguno, pero el hecho de existir varias estrellas no impide la posibilidad de que haya planetas orbitando.

Las estrellas tiene diversos tamaños y masas. El sol no es una particularmente grande.

Primeros datos

Sabiendo que dista 1.496 x10 11 metros de la tierra (unos cinco minutos luz) y que el diámetro angular que tiene, visto desde ella es algo menor que medio grado es sencillo obtener que su radio es de $latx R=6.9 x10^8 $ metros. Es decir, 109 veces mayor que el radio de la tierra. Para hacerse una ide la tierra cabría perfectamente dentro de la fulguración que aparce en la foto de arriba.

Por la ley de gravitacion universal:
F=-G.M.m/r^2

es sencillo estimar que la masa del sol es 1.99 x 1030 kgs.

De aquí puede deducirse que su densiad media es algo superior a la del agua. Concretamente la de un yogurth.Sin embargo no esta unifromente distribuida la masa en el Sol. Se sabe que la zona central es mucho mas densa. Más o menos como el plomo.

La temperatura de al superfice puede estimarse de la ley de Planck para la emision del cuerpo negro. El sol emite en muchas longitudes de oda. Pero su máximo de emision corresponde a la luz visible. Sustituyendo en la ley de Planck:

I(\nu ,T) = \frac{2h\nu^{3}}{c^2}\frac{1}{e^{\frac{h\nu}{kT}}-1}

(aquí I(\nu)\delta\nu es la cantidad de energía por unidad de área, unidad de tiempo y unidad de ángulo sólido emitida en el rango de frecuencias entre \nu y \nu + \delta \nu \,

se encuentra que la temperatura es T=5780º Kelvin.

La fuente de la energía del sol

Hoy ya se sabe, lo enseñan en las escuelas, que el sol es una gigantesca bomba de fusión.

Pero ese conocimiento es reciente. Hasta la primera explosión de fusión, por los años 40 ó 50 del pasado siglo XX no se tenía certeza total de que esta fuera una energía viable. Hasta 1935 no se empezó siquiera a tomar seriamente esta conjetura.

Sin embargo ya en el siglo XVII o XIX había un conocimiento científico bastante establecido. Y se usaban unas técnicas matemáticas muy superiores a las que hay en la enseñanza básica o secundaria actual. ¿Que podía decir esta ciencia acerca del “motor energético” del sol?

Los primeros en afrontar con rigor esta pregunta fueron Kelvin y Helmholtz. Barajaron la hipótesis de que la fuente de energía fuera la contraccion gravitatoria.Es sencillo calcular que una esfera uniforme de masa M y Radio R posee una energía potencial gravitatoria de:

V=-3/5 .GM* 2/R

Esto representa también la energía que liberaría esa misma masa al ser llevada desde el infinito hasta estar agrupada en esa esfera.Sustituyendo el valor de la mas del Sol se obtiene que la energía liberada sería: E=2.4×1041 J

Como observacionalmente se sabe que el sol emtie radiaccion a razón de L=4×1028 J/s se puede estimar que si este fuera el mecanismo del que obtiene su energía el sol podría haber existido desde hace:

t=E/L=6x10* 14 segundos

Por mediciones hechas por los geóglogos se sabe que la antiguedad de la tierra es superior a esa fecha. Y como es muy improbable que la tierra exista desde antes que el sol se podía suponer que la fuente de energía del sol era otra. Como ya avancé ante se trataba de la energía de fusión. En concreto el sol sigue lo que se conoce como cadena p-p. Otras estrellas mas masivas siguen el conocido como ciclo CNO (carbono, nitrógeno, oxígeno) del que no daré detalles.

La cadena p-p, básicamente, es la formación de helio a partir de hidrógeno. Sin embargo los detalles son algo mas complejos y hay pasos intermedios En concreto se tiene:

¹H + ¹H → ²H + e+ + νe
(fusión de dos núcleos de hidrógeno ¹H (protones) a deuterio ²H, liberando un positrón y un neutrino al transformar un protón en un neutrón)

Tras esta reacción el deuterio producido en el primer paso se puede fusionar con otro hidrógeno para producir un isótopo ligero de helio ³He:

²H + ¹H → ³He + γ + 5.49 MeV

³He +³He → 4He + ¹H + ¹H + 12.86 MeV

(el helio-4 se produce por la fusión de dos núcleos de helio-3)

Decir que esto es la cadena P-p1. Hay otras opciones que varían de esta en el último punto de la reacción. No las escribiré aquí.

Ecuaciones de la estructura estelar

Fue en los años 20, antes de que estuviera completada la mecáncia cuántica, cuando Edington escribió por primera vez las ecuaciones de estructura del sol.

Consideremos que la estrella tiene una masa M y un radio R. Tomemos un punto interior de la estrella, p, situado a una distancia r de su centro. Debido a la atracción gravitatoria del resto dela estrella un trozo de masa situado en p es atraído por la masa, M(r) interior al punto p (recuérdese que una corona esférica no produce campo gravitatorio en su interior). Para que esa materia permanezca estacionaria debe ser contrarrestada por la presión hidrostática P, de la estrella. Ello resulta en la ecuación:

\frac{dP}{dr} = - \frac{ G m \rho }{ r^2 }

dónde \rho es la densidad de materia en p.

La segunda ecuación describe la relación geométrica entre la masa y la densidad:

\frac{dM(r)}{dr} = 4 \pi r^2 \rho .

La siguiente ecuación, la ecuación de estado, relaciona la presión con la densidad y la temperatura, T.

P=\frac{\mathfrak{R}}{\mu}\rho T + 1/3a T^4

P, como antes, es la presión. El primer término de la derecha indica la contribución del material gaseoso (puede reconocerse fácilmente que es muy similar a la ecuación de los gases ideales). El segundo término de la derecha describe la presión de la radiación (puede intuirse una relación con la ley de Wein, aunque hay que ser cauteloso, estrictamente es la presión debida a partículas ultrarelativistas). \mathfrak{R} y a son constantes obtenibles de experimentos de laboratorio. \mu es el peso molecular medio de la materia en el punto p. Para una estrella compuesta exclusivamente de hidrógeno valdría 1/2.

La cuarta ecuación describe el transporte y absorción de energía a través de la estrella. Si L(r) es la energía que fluye hacia afuera de la superficie de radio r y K es la opacidad de la materia en P se tiene que el transporte de energía hacia el exterior irá acompañado de un descenso de la temperatura, T, dado por:

4/3 a T^3\frac{dT}{dr}= - \frac{KL(r)}{16\pi^2 cr^2} \rho

Por último, si \epsilon es la tasa de generación de energía por unidad de volumen (determinable a partir de los datos de las reacciones termonucleares relevantes), se tiene:

\frac{dL(r)}{dr}=4\pi r^2\epsilon .

Este es un sistema de ecuaciones diferenciales ordinarias. Salvo por el término en T^4 de presión de radiación estamos ante ecuaciones lineales y por tanto podrían resolverse de manera relativamente sencilla. En algunos casos puede despreciarse ese término. De hecho sin ni siquiera resolver las ecuaciones y asumiendo unas simplificaciones muy toscas puede obtenerse una expresión para la temperatura central del sol que nos da un valor de 10 millones de grados Kelvin.. Cálculos mas refinados dan una temperatura de 13 millones de grados.

Otra versión, ligeramente distinta, de las ecuaciones de estado del sol puede verse en la wiki inglesa: http://en.wikipedia.org/wiki/Stellar_structure.

Por supuesto lo visto aquí es muy elemental. Una referencia para ampliar información podría ser, por ejemplo, “They physics of stars” por A.C. Phillips (John Willey & Sons, 1994)

Aparte de referencias técnicas hay libros, bastante recientes, de divulgación sobre física solar. También en investigación y ciencia aparecen buenos artículos sobre el tema con cierta regularidad. Y, desde luego, mediante google se podrá encontrar muchísima mas información de la que se pueda tener tiempo de asimilar. Eso sí, posiblemente mucha de esa información estará en inglés y tal vez para los que no dominen ese idioma esta entrada pueda serles de algo de ayuda.

Para terminar vuelvo al tema del satélite SDO. Hay unas cuantas incógnitas importantes sobre física solar, y con esto del “fin del mundo maya” seguramente de dirán muchas tonterías. La web de ese satélite puede ser un buen punto de inicio para tener información fidedigna sobre lo que este haciendo el sol en cada momento y sobre lo que e vaya descubriendo sobre él.

Solitones

abril 14, 2010

En lo que ha venido a conocerse como “teoría del caos” se analiza el hecho de que la presencia de términos no lineales en ecuaciones dinámicas (en diferencias o diferenciales) puede resultar en comportamientos en los que hay una gran sensibilidad en las condiciones iniciales que convierten el sistema dinámica en algo impredecible a largo plazo.

Sin embargo este no es el único aspecto interesante que surge en presencia de no linealidad en las ecuaciones. Un fenómeno bastante singular es la aparición de lo que se conoce como “solitones”. Un solitón es un tipo de onda que mantiene su forma incluso cuando se propaga en un medio dispersivo. Aquí se hará una introducción a los aspectos más sencillos de la teoría de los solitones. Principalmente se analizará la ecuación de Koterweg- de Vries, pero también se mencionarán algunos otros tipos de solitones.

Historia
La primera observación histórica documentada de un solitón la hizo en 1834 el ingeniero naval inglés John Scott Russell. Mientras paseaba a caballo observo por un canal de agua poco profundo vio que una barca arrastrada por unos caballos sufrió un incidente y se paró bruscamente. a resultas de ello se formó una onda solitaria que avanzó por el canal durante largo tiempo sin desvanecerse. Como son bastante famosa dejo aquí las palabras que usó para describir su descubrimiento:

“I was observing the motion of a boat which was rapidly drawn along a narrow channel by a pair of horses, when the boat suddenly stopped – not so the mass of water in the channel which it had put in motion; it accumulated round the prow of the vessel in a state of violent agitation, then suddenly leaving it behind, rolled forward with great velocity, assuming the form of a large solitary elevation, a rounded, smooth and well-defined heap of water, which continued its course along the channel apparently without change of form or diminution of speed. I followed it on horseback, and overtook it still rolling on at a rate of some eight or nine miles an hour, preserving its original figure some thirty feet long and a foot to a foot and a half in height. Its height gradually diminished, and after a chase of one or two miles I lost it in the windings of the channel. Such, in the month of August 1834, was my first chance interview with that singular and beautiful phenomenon which I have called the Wave of Translation”.

Tras eso Russel realizó un análisis teórico y algunos experimentos. Experimentalmente halló hechos como que el volumen de agua en la onda era igual al volumen de agua desplazada por la perturbación inicial. Más interesante, descubrió que la velocidad de la onda solitaria (el la denominó, como se lee en el texto en inglés, “onda de traslación”) cumplía:

1. c^2=g(h+a)

dónde a es la amplitud de la onda, h la altura del canal de agua dónde se forma la onda y g es la aceleración de la gravedad. El aspecto clave es que la velocidad de la onda depende de su amplitud (altura). Posteriormente Boussinesq (1871) y Lord Rayleigh (1876) asumieron que la longitud de la onda tenía una escala mucho mayor que la profundidad de el agua y dedujeron un perfil par la onda. El paso final para establecer la teoría clásica lo dieron Kortewev y de Vries en 1895. A partir de las ecuaciones de Euler de los fluidos obtuvieron su famosa ecuación y analizaron algunas de sus propiedades mas sencillas. La deducción que ellos hicieron es bastante larga y puede encontrarse en, por ejemplo: http://panda.unm.edu/Courses/Finley/p573/solitons/KdVDeriv.pdf. Aquí se usará una deducción alternativa basada en las propiedades de dispersión de un medio.

Mucho mas tiempo después (1953) Fermi, Pasta y Ulam hicieron una serie de investigaciones numéricas -usando algunos de los primeros ordenadores digitales jamás construidos- sobre redes cristalinas monodimensionales, una cadena de iones susceptibles de vibrar (fonones). Fermi esperaba que el sistema se comportase ergódicamente y que la energía se distribuyese equitativamente entre los modos de vibración disponibles. Sin embargo las investigaciones mostraron que se producía un comportamiento cuasiperiódico. El tipo de fenómenos que aparecían podían interpretarse como si se formase algún tipo de cuasi-partículas localizadas en una pequeña zona de la cuerda vibrante. Siendo un físico de partículas Fermi las denominó “solitones”, que es el nombre actualmente usado para ese tipo de fenómenos.

Un hecho nuevo e interesante que apareció en esos estudios es que los solitones podían colisionar entre sí y emerger tras la colisión manteniendo su forma. Veremos aquí esto aquí mas adelante usando las soluciones n-solitón obtenidas unos cuantos años mas tarde porToda.

En 1965 Kruskal y Zabuski demostraron que el límite en el continuo del sistema de Pauli era la ecuación de KdV. Y pudieron relacionar sus resultados numéricos con las soluciones clásicas de esta ecuación.

Otros desarrollos posteriores dignos de reseñar son el método general para obtener una solución de la ecuación de KdV para unas condiciones de contorno dadas mediante la técnica de scatering inverso. También es interesante la conexión de la ecuación de KdV y lo que se conocen como pares de Lax.

Otra característica interesante es analizar porque se pueden obtener soluciones exactas de esta ecuación no lineal y porque no tiene comportamiento caótico (sensibilidad a las condiciones iniciales). El motivo es que esta ecuación tiene un número infinito de cantidades conservadas. En general una ecuación en derivadas parciales que exhiba estas características no va a tener comportamiento caótico. En este trabajo se analizará este aspecto basándose en el trabajo de Miura y compañía hecho en 1968.

Las soluciones tipo solitón son estables en diversos sentidos. No requieren condiciones iniciales demasiado especiales, y siguen existiendo si se modifican esto. Y también son estables bajo pequeños cambios en la ecuación diferencial que lo describe, por ejemplo si se añade un término de disipación (estabilidad estructural). Esta estabilidad es lo que permite que en la práctica lleguen a observarse este tipo de ondas en diversos fenómenos. Con todo es interesante partir de este tipo de soluciones y analizar que añadidos se les debe hacer para que pasen a tener comportamiento caótico.

En lo que sigue analizaremos algunos de los aspectos comentados y se reseñarán al final algunas consideraciones sobre el tema que no serán tratadas, pero que no está de más el estar informado de su existencia

Ecuaciones de onda y la ecuación de Koterweg- de Vries

Es bien conocida la ecuación en derivadas parciales lineal de 2º orden de tipo hiperbólico que describe la propagación de una onda:

2. \frac{\partial^2\phi}{\partial t^2}-c^2\frac{\partial^2\phi}{\partial x^2}=0

Las soluciones de esta ecuación describen ondas que se propagan a una velocidad, c, que es independiente de la frecuencia de la onda. Asumiendo que la onda se propaga en un medio tenemos que ese medio es no dispersivo. La ley de dispersión es la relación entre la frecuencia,w, y el número de onda, k, de las ondas que se propagan en él. En un medio no dispersivo se cumple: \omega^2= c^2 k^2. En general -para el caso de un medio isótropo- se tendrá una relación de la forma \omega^2 = f(k^2) . Si asumimos que la dispersión es muy pequeña podemos desarrollar por Taylor y obtener: \omega^2= c^2 + \Gamma k^4 . Esto nos lleva, asumiendo que \Gamma k^2\ << c^2 a la expresión final:

3. \omega(k)= ck - \beta k^3

Si proponemos que la ecuación de ondas que nos interesa tendrá una solución, la famosa onda plana, de la forma:

4 u(x,t)= e^{i(ckx - \beta \omega t)}

Podemos ver, teniendo en cuenta la acción del operador derivad parcial en esa solución de prueba, que la ecuación que buscábamos será:

5. u_t + c u_x + \beta u_{xxx} = 0

(Aquí se ha usado la notación de subíndices para las derivadas parciales).

El término responsable de la dispersión es el de la derivada tercera. Puede verse fácilmente que ahora si tenemos que la velocidad depende el número de onda. En particular se cumple c=\frac{\omega}{k}= 1 - k^2

Hago aquí un breve inciso para aclarar un punto que no suele comentarse en los textos sobre solitones y que tal vez pueda desconcertar a un físico que lee sobre este tema si intenta meditar sobre el asunto. Posiblemente el caso mas conocido de medio dispersivo sea un medio óptico (medio en el que pueden propagarse ondas electromagnéticas). En esos medios se tiene que la velocidad de la luz depende de su longitud de onda (asociada de manera únivoca a su número de onda). Sin embargo la ecuación de ondas en un medio óptico sigue siendo la ecuación de ondas lineal y no es necesario introducir ningún término con derivadas terceras (aparte de que la derivada temporal en la ecuación de ondas es de 2º orden y no de primero como en la ec. 5). ¿dónde esta el truco?. Bien, en la ecuación 2 hemos puesto la constante c, sin explicar su origen. Dicho origen depende según la física que estamos describiendo de diversos factores. En el caso de una onda electromagnética dependerá de la constante dieléctrica y la permitividad magnética del medio que aparecen en las ecuaciones macroscópicas de Maxwell (estas son básicamente las mismas que en el vacío sustituyendo las permeabilidades del vacío por las del medio). Estas constantes en general dependerán de la longitud de onda (y normalmente van a cumplir las relaciones de Kramers- Kronig). En el análisis de solitones la naturaleza de la dispersión se introduce como hemos señalado, y de ahí las diferencias.

Nótese que habíamos avanzado que la ecuación de KdV era una ecuación no lineal y que nuestra ecuación 5 es lineal. Eso significa que aun nos falta por introducir la no linealidad, y justificar su presencia. El punto clave es que si las ondas de distinto número de onda se propagan a distintas velocidades y por el análisis de Fourier, sabemos que una perturbación arbitraria estará compuesta por modos de diverso número de onda. Como estos se propagan a distinta velocidad se tendría que la forma inicial de la onda se iría difuminando con el tiempo y no tendríamos solitones. Necesitamos algo que contrarreste esa tendencia.

Pasamos a analizar un tipo sencillo de ecuación con un tipo simple de no linealidad, lo que se conoce como ecuación invíscida (osea, sin término de viscosidad) de Burguers:

6. u_t + (1 + u) u_x= 0

Buscaremos la solución de esta ecuación mediante el conocido método de características. En particular se tiene que u es constante en las líneas que cumplen \frac{dx}{dt} = 1 + u . Y que, por consiguiente, las curvas características son: x= (1 + u) t  + cte . De ese modo la solución general es:

7. u(x,t) = f(x - (1 + u)t) .

con f una función arbitraria. En definitiva, tenemos que para un perfil inicial u(x,0) = f(x) podemos obtener por el método de las características una solución única que propaga la solución a través de las curvas características. En realidad las cosas no son tan sencillas como parece y esta solución es válida solo localmente. En general pasado un cierto tiempo las soluciones, al menos una parte de las mismas, “estallarán” (en inglés blow-up) lo que corresponde físicamente con que el perfil de la onda se romperá. Nótese también que este transporte a través de las curvas características no es exactamente una onda en el mismo sentido que las soluciones de d’Alambert a la ecuación de ondas lineal.

Pero, con todo, ya tenemos los dos ingredientes básicos. Podemos combinar un término de dispersión con un término no lineal y obtener la ecuación de Korteweg -de Vries:

8. u_t + (1 + u) u_x + u_{xxx} =0

Si añadiésemos en vez de un término de dispersión uno de disipación obtendríamos otra ecuación bastante conocida, la ecuación de Burguers:

9. u_t + (1 + u) u_x + u_{xx} =0

También podríamos combinarlas en una ecuación que contuviese un término de dispersión y uno de disipación. Aquí se va a tratar el caso con dispersión, pero es interesante saber que si se añade disipación no se van a perder las características tan interesantes que cumplen las soluciones de la ecuación de KdV. Antes de proceder a analizar la ecuación simplemente señalar que mediante sencillos cambios de variables puede escribirse en su forma mas habitual:

10. \partial_t \phi + \partial^3_x \phi + 6\, \phi\, \partial_x \phi =0

Soluciones de la ecuación de KdV

Vamos a analizar, como habíamos comentado antes que era nuestro interés, soluciones tipo D’Alambert para la ecuación KdV. Es decir, soluciones del tipo u(x,t)=f(x-ct). Si sustituimos esta expresión de la solución en la ecuación 1o obtenemos una ecuación diferencial ordinaria:

11 . cf'  -6ff' + f'''=0

Integrando una vez se obtiene:

12. -cf  -3 f^2 + f''=A

dónde A es una constante. Si se usa f’ como un factor integrante y se integra una vez mas se obtiene:

13. 1/2(f')^2=f^3 + 1/2 f^2 + Af  + B

dónde B es una segunda constante arbitraria.

Para poder seguir avanzando es necesario imponer condiciones de contorno. Las mas sencillas posibles corresponden a elegir f, f' , f '' \rightarrow 0 cuando \xi =x -ct \rightarrow  \pm \infty . En ese caso A y B son 0 y la ecuación puede integrarse fácilmente dando el resultado final:

14. f(x-ct)= -1/2csech^2 (1/2c^{1/2}(x-ct - x_0))

dónde x_0 es una constante de integración.

De esta solución pueden deducirse de manera sencilla estas dos propiedades características que había obtenido experimentalmente Russell:

i. La amplitud es la mitad de la velocidad.

ii. Su anchura es inversamente proporcional a su altura, es decir, ondas mas alta se mueven mas rápido (y por la propiedad i son mas estrechas).

A nivel conceptual es interesante señalar lo que de particular tiene la existencia de esta solución de onda que se propaga. Su existencia depende de la competitividad entre dos fenómenos que actúan en sentidos opuestos: La dispersión (asociada a la derivada tercera) y la tendencia a destruir la onda (fenómeno shock wave que se vio cuando se analizó la solución de la ecuación invíscida de Burgues mediante el método de las características).

Esta es la solución mas sencilla posible, y se corresponde con la onda que observó Russell por vez primera. Pero definitivamente hay mas soluciones de esta ecuación. Esas soluciones se expresan en términos de las funciones elípticas cn de Jacobi. Cómo es demasiado asumir que todo el mundo este familiarizado con dichas funciones se darán aquí algunas nociones básicas e imprescindibles sobre el tema.

Primero definimos la integral:

15. v=\int_0^\phi \frac{d\theta} {\sqrt {1-m \sin^2 \theta}}

Esta integral es análoga a:

16. w= \int_0^\psi \frac{dt}{\sqrt{1-t^2}}

en 16 si ponemos w=sen (\theta ) se ve que w=arccsen (\psi) o que sen( w) = \psi , es decir, que 16 define la función trigonométrica arcsen. Esto llevo a Jacobi (y a Abel) a definir a partir de 15 dos nuevas funciones:

17. sn( v) = sen( \phi)

y

18. cn(v) = \cos (\phi)

Aunque en la definición no es transparente estas funciones dependen del parámetro m presente en la integral. Si quiere tenerse en cuenta este parámetro se usa la notación sn (v |m) y cn (v |m).

Dos casos especiales, m=0,1, permiten reducir la integral 15 a formas conocidas e integrables. En particular para m=0 se tiene:

19. v= \phi  y por tanto cn (v|0)= cos(\phi)=cos(v)

Para m=1 se obtiene:

20. v= arseh(cos \phi) y por tanto cn(v|1)=sech (v)

De aquí se puede concluir que sn v y cn v son funciones periódicas para 0 \le m  < 1 pero que la periodicidad se pierde para m=0.

Una tercera función elíptica posible es:

21. dn(v) = \sqrt {1-m\sin^2 \phi}

Algunas propiedades útiles de estas funciones son:

a) sn^2 + cn 2=1

b) dn^2 + k^2 cn^2=1

c) \frac{\mathrm{d}}{\mathrm{d}z}\, \mathrm{sn}\,(z) = \mathrm{cn}\,(z)\, \mathrm{dn}\,(z)

d) \frac{\mathrm{d}}{\mathrm{d}z}\, \mathrm{cn}\,(z) = -\mathrm{sn}\,(z)\, \mathrm{dn}\,(z),

e) \frac{\mathrm{d}}{\mathrm{d}z}\, \mathrm{dn}\,(z) = - k^2 \mathrm{sn}\,(z)\, \mathrm{cn}\,(z).

Ciertamente este brevísimo sumario de definiciones y propiedades no hace justicia a la rica rama de las matemáticas que son en si mismas las funciones elípticas, íntimamente ligada a la teoría de curvas elípticas y a algunos aspectos de la teoría de números. Algo mas de información puede obtenerse en la página correspondiente de wikipedia http://en.wikipedia.org/wiki/Jacobi%27s_elliptic_functions

Tras este breve inciso sobre funciones elípticas volvemos al tema de las soluciones de la ecuación de KdV. Si uno considera condiciones de contorno periódicas, es decir que la función en meno infinito valga lo mismo que en mas infinito (lo que equivale a transformar la recta real en un círculo) puede verse que la solución a la ecuación de KdV se puede escribir, haciendo unos pequeños cambios de variable y notaciones, como:

22. u(x,t)= 2a^2k^2 cn^2(a(x - 4(2k^2 -1) a^2t)

Korteweg y de Vries denominaron a estas soluciones ondas cnoidales. Aquí k es el módulo de la función elíptica cn. Puede verse que para k \rightarrow 1 cn converge a sech y de ese modo se recupera la solución de onda solitaria como un caso límite.

En este tipo de soluciones la relación entre amplitud y velocidad de la onda es mas compleja que en el caso de la “onda solitaria” y el análisis requiere el uso de propiedades de las funciones elípticas incluyendo valores que deben ser hallados numéricamente (o buscados en tablas) y no se tratará aquí. Mencionar que este tipo de ondas aparecen en fenómenos reales, como por ejemplo en ríos o canales. Esta foto antigua muestra ondas cnoidales en el canal de Panamá:

Se pueden obtener mas soluciones de la ec. de KdV. Hay una manera sistemática de hacerlo por un procedimiento iterativo. Ahí se postula un 1-solitón, que es básicamente la onda solitaria hábilmente reescrita y se postula una forma para forma para el 2-solitón que depende de la forma del 1-solitón y de unas constante. Sustituyendo esta forma en la ecuación se despeja el valor de las constantes y se obtiene el 2 solitón. Aplicando el procedimiento se obtiene el n-solitón. Esta técnica la desarrolló Toda. Usando esa técnica se puede obtener la siguiente expresión para el 2-solitón:

23. u(x,t)=12\frac{3 + cosh(2x-8t) + cosh(4x -64t)}{(cosh(3x - 36t) + 3 cosh(-28t))^2}

El motivo por el que escribo la expresión de esta solución, sin ofrecer los detalles de como se obtiene, es que analizando sus propiedades se puede ilustrar una de las características de los solitones que mencionamos en la introducción histórica, las colisiones de solitones.

Para t grande y negativo u(x,t) es asintóticamente igual a 2 sech^2(x - 4t - \phi) + 8 sech^2(x - 16t + \phi /2) mientras que para t grande y positivo es igual a 2 sech^2(x - 4t + \phi) + 8 sech^2(x - 16t - \phi /2) dónde \phi= log(3)/3 .

La interpretación de esta matemática es la siguiente. Para t negativos grandes tenemos dos solitones separado, uno a la izquierda y otro a la derecha, moviéndose ambos hacia el centro según avanza t. Para un entorno de t=0 se tiene que ambos solitones emergen en uno sólo que posteriormente, para t positivo y grande, se convierte de nuevo en dos solitones, iguales a los de t negativo, alejándose de x= 0. El único efecto de la interacción es introducir un pequeño cambio de fase que se corresponde a un pequeño retraso del solitón respecto a la posición que ocuparía si no hubiese interaccionado con su compañero. Aunque matemáticamente estas propiedades se establecieron muchos años después hay constancia de que en sus experimentos en tanques de agua Russell observo esta interacciones entre solitones.

Constantes de movimiento en la ecuación de KdV

Miura, en 1968, introdujo una función w mediante la relación:

24. u= w + \epsilon \frac{\partial w}{\partial x} + \epsilon ^2 w^2

dónde \epsilon es una constante arbitraria. Usando la definición de w, y sustituyendo en la ecuación de KdV se llega a.

25. \frac{\partial w}{\partial t} + \partial / \partial x (\frac {\partial ^2 w}{\partial x ^2} - 3 w^2 - 2\epsilon w^3)=0

\frac{\partial w}{\partial t} + \frac {\partial F_w}{\partial x} = 0

para todo \epsilon . Esto esta en la forma de una ley de conservación con F_w el flujo de w. Pero \epsilon es una constante arbitraria y por tanto tenemos un número infinito de leyes de conservación para funciones de la variable original u. Para verlo ponemos w(u) como una serie de potencias en epsilon:

26. w= \sum_{m=0}^\infty  \epsilon ^m w_m

Encontramos que w_0= u , w_1= - \frac{\partial u}{\partial x} , w_2= - \frac{\partial  ^2 u}{\partial x^2 - u^2} , etc. Estas ecuaciones de conservación pueden ser integradas sobre x desde – infninito hasta + infinito y asumiendo que la solución va a 0 en los puntos de frontera se llega a :

27. \frac {dI_n}{dt} = 0

I_n= \int_{ - \infty}^{+ \infty} w_n(u(x,t))dx

Aunque no justificaremos aquí el motivo puede verificarse que se pueden interpretar las dos primeras cantidades conservadas como, respectivamente, el momento y la energía de la onda.

Realmente hay diversos modos de obtener las leyes de conservación. Por ejemplo uno de ellos usaría técnicas de hamiltonianos, pero explicarlo nos llevaría a complejidades que no pretendo introducir en este texto.

Lo interesante es saber que si podemos hallar etas cantidades conservadas la ecuacion diferencial no tendrá comportamiento caótico.

Conclusión

Se han visto algunas de las propiedades mas sencillas de los solitones. Este tipo de solitones son ilustrativos de fenómenos interesantes que aparecen en el estudio de sistemas no lineales de ecuaciones en derivadas parciales diferentes al famoso caos (sensibilidad en condiciones iniciales). Aunque por motivos de mantener el texto en unas proporciones razonables se han omitido muchos aspectos señalar que, por ejemplo, puede aprovecharse lo que hemos aprendido sobre interacción no lineal de diversos modos para crear un modelo en que la fase de cada modo actúe de manera arbitraria y obtener un modelo para estudiar el fenómeno de la turbulencia débil. En general para hacer eso de una manera adecuada sería una buena idea introducir las técnicas de ecuaciones diferenciales estocásticas, lo cuál es un tema muy interesante en si mismo.

Aparte de sus relaciones con el caos los solitones son interesantes en si mismos tanto en su aspecto matemático como en física y resto de ciencias aplicadas ya que la ecuación de KdV y otras con similares características aparecen en sistemas naturales y en otros artificiales de gran interés práctico. Esto incluye temas tan dispares como la óptica no lineal o los impulsos neuronales que alguna gente cree que podrían estar debidos a ondas solitónicas en las membranas celulares de las neuronas.

Para concluir una importante aclaración final. Aquí se han tratado los solitones por así decirlo “analíticos”. Aquellos que hayan estudiado teoría de campos o teoría de cuerdas habrán visto la introducción de diversos tipos de objetos que también llevan el nombre de solitones y cuya relación con lo visto aquí es harto compleja de vislumbrar. En el caso de las teorías gauge estamos ante lo que se conoce como solitones topológicos. Se trata de cantidades conservadas debido a que los valores del campo gauge en el infinito (que tiene la topología de una 3 esfera) toman configuraciones que no pueden obtenerse unas de las otras mediante transformaciones continuas. Ese tipo de configuraciones pueden interpretarse como soluciones localizadas en una cierta región del espacio relativamente pequeña y con energía finita. Tiene por tanto características similares a partículas y en ese sentido se parecen a los solitones aquí estudiados. En el caso particular de teorías de gran unificación algunas de esas soluciones solitónicas puede verse que comparten algunas de las propiedades de los monopolos que introdujo Dirac en un intento de obtener una teoría simétrica del electromagnetismo. De hecho son una predicción ineludible de esas teorías de gran unificación y el hecho de no haberse encontrado requiere algún tipo de justificación (por ejemplo su dilucción durante la inflacción) si quiere mantenerse la consistencia de esas teorías de unificación. Ciertamente ese es un tema que no esta relacionado con lo que se ha visto aquí, pero es interesante señalar su existencia para evitar posibles confusiones con el término solitón.

Otro tipo de uso común en física de partículas de la palabra “solitón” aparece en la ecuación en derivadas parciales de seno gordón. Ese tipo de solitón puede estudiarse de manera en parte similar a lo visto aquí y en parte por razonamientos de tipo topológico. En ese sentido estaría un poco a medio camino entre ambos casos. No entraré a fondo en analizar esas posibles coincidencias pues no es aproiado para el propósito del presente texto.

Referencias

Una introducción sencilla al tema de los solitones dentro de un estudio general de los diversos aspectos de las ecuaciones no lineales es el libro de Henry D. I. Abarbanel M. I Rabinovich y M .M Suschik “introduction to nonlinear dynamics for physicists” disponible en Wrold Scientific.

Un texto clásico sobre teoría de solitones es: “Solitons: an introduction” por P. G. Drazin, R. S. Johnson editado por CAM BRIDGE TEXTS IN APPLIED MATHEMATICS .

Otro texto interesante, de un nivel matemático algo superior, es “An introduction to wave equations and solitons” escrito por Richard S. Palais. Esta disponible online en http://www.ma.utexas.edu/~uhlen/solitons/notes.pdf.

La wikipedia inglesa también es una buena fuente de información en sus entradas sobre solitones, la ecuación de kowerteg de Vries o las cnoidal waves.

En esas referencias puede encontrarse abundante información sobre lo que se ha tratado aquí y también sobre lo que no se ha tratado (método de scatering inverso, pares de Lax, etc).

Sobre el otro tipo de solitones, los usados en teorías cuánticas de campos, aparte de las introducciones usuales en los textos clásicos una referencia específica sería: “Solitons and instantons: An introduction” Por R. Rajaraman