Archive for 29 junio 2009

La conjetura de Poincaré: I

junio 29, 2009

Posiblemente alguna gente recordará que en el 2003 hubo bastante revuelo en el mundo de las matemáticas. La causa era que por fin parecía haberse demostrado uno de los “problemas del milenio” del instituto Claymath, la conjetura de Poincare que enuncia que cualquier variedad compacta simplemente conexa es equivalente a la 3-esfera (a lo largo del post iré explicando que significan estos términos). El autor de la demostración era un peculiar matemático ruso, Grigory Perelman, basándose en los trabajos de Richard Hamilton (no confundir con Willian Rowan Hamilton, el de la mecánica hamiltoniana) sobre lo que se conoce como flujo de Ricci. en 2006 se le concederia, durante el transcurso del congreso internacional de matemáticas, celebrado en Madrid, la medalla fields de matemáticas. Eso sí, la rechazaría, pero eso es otro asunto.

En el 2007 Donal O’Shea publicó un libro dedicado a esta conjetura y su historia. La traducción al español es del 2008 y en este post comentaré el libro, y la conjetura en si misma.

El libro esta dirigido, aparentemente, a un publico genérico al que no se le presupone especiales conocimientos en física y matemáticas. Ciertamente hay mucho en ese libro que cualquiera puede aprovechar. No obstante algunos aspectos no tengo claro hasta que punto se pueden apreciar realmente bien si no se tiene una buena base en matemáticas, especialmente en topologia y en geometría de variedades. Aparte de los aspectos técnicos el libro es muy detallado en ls aspectos históricos y sociológicos. Yo he leído varios libros de historia de las matemáticas (y biografías de físicos y de matemáticos) y aún así he aprendido detalles muy interesantes en este aspecto en este libro.

El libro empieza contándonos la presentación de Perlman de sus resultados en una reunión de matemáticos a la que ha asistido el autor. Sirve para crear una atmósfera de expectación que justifica la existencia del libro

En los siguientes capítulos, dedicados ala antigüedad principalmente, empieza preguntándose por la forma del mundo. Esto le sirve al autor para presentar varios temas. Por un lado nos va a presentar la idea de como representar la superficie de la tierra en mapas y la idea de un atlas (conjunto de mapas que representan el total de la superficie terrestre). Esto es en el fondo la idea que esta detrás del concepto de variedad bidimensional. Cualquier entorno local de la misma puede ponerse en una correspondencia 1-1 con un trozo de \mathbb R^2 . Dependiendo de si esa correspondencia es continua, diferenciable o lineal a trozos así es la variedad (esta es una observación mía que no esta presente en el libro). También aprovecha para repasar la falsa idea de que en la edad media se creía que la tierra era plana. En realidad la gente culta sabía que la tierra no era plana desde al menos la época de la Grecia clásica. Si uno lo piensa es fácil convencerse de que debía ser así. De un lado tenemos la observación de que lo último que desaparece de la vista cuando un barco se aleja en el horizonte es el mástil, lo cual encaja con que la superficie de la esfera sea curva. Por otro lado tenemos que la sombra de la tierra en la luna durante un eclipse es un círculo. Yo añadiría que el hecho de que la luna se vea como un círculo desde diversos puntos de la tierra sólo es compatible con que la luna sea una esfera. y si la luna es una esfera uno puede imaginar que la tierra también lo és.

En cualquier caso hay documentos históricos que avalan estos hechos. En particular en la época de Colón estaba claro que la tierra era una esfera. Incluso se tenía una medida muy acertada de su radio. Precisamente por eso los portugueses rechazaron la propuesta de Colón ya que el trayecto que el proponía era demasiado largo. De hecho este dato fue bien conocido por los historiadores de siglos posteriores. La percepción del público general de hoy día de que en esa época se creía mayoritariamente en una tierra plana es algo reciente. Se debe a unos versos de Wasington Irving (el autor de “cuentos de la alhambra” entre otors libros) presentados en un acto conmemorativo que daban a entender lo contrario. La gente se quedó con esa cantinela y se ignoró la bien documentada verdad. Ciertamente extenderme tanto en eta anécdota dada la cantidad de cosas que debo presentar en este post parece excesivo. Pero no deja de ser inquietante plantearse cómo la percpecion general del público de hecos historicos trascendentales puede depender de aparentes nimiedades cómo las de un verso afortunado (o desfortunado).

En esos primeros capítulos presenta otros aspectos muy relevantes a lo largo del resto del libro. Por ejemplo, en el cuarto, los postulados de Euclides. Es bien conocido (por los aficionados a la divulgación al menos) que el quinto postulado abriría la puerta a las geometrías no euclideas.

En el tercer capítulo cuestiones sobre como a partir de datos locales, mapas detallados, podemos inferir aspectos globales sobre el mundo. Un atlas suficientemente detallado podria distinguir un mundo esférico de uno de forma toroidal incluso si no tuvieramos medos de ver el planeta desde fuera.

El siguiente capítulo, el cuarto, se pregunta sobre la forma del universo. Ahí presenta descripciones muy detalladas sobre aspectos de la 3-esfera muy curiosos. Muy agradable de leer ese capítulo. Además no olvidemos que la 3-esfera es una pieza clave en la conjetura de Poincaré. Y, por supuesto, generaliza el concepto de superficie al de variedad n-dimensional.

El quinto y sexto capítulo ya se sitúan en tiempos mas recientes. Nos habla sobre como se forjan las geometrías no euclideas en los trabajos de Gauss, Lobachevsky y Bolyai. También nos cuenta muchos detalles de la vida personal y profesional de estos matemáticos y de cómo era la sociedad de esos tiempos en Europa. Cubre aspectos generales de la sociedad y, sobre todo, de las características de las universidades de la época, y de la investigación matemática en general.

El trabajo de Gauss se centra en la geometría diferencial de las superficies bidimensionales. Ya Euler había trabajado en ese tema. La novedad del enfoque de Gauss es que hace hincapié en definir los objetos matemáticos (curvaturas principalmente) en términos de cantidades locales, independientes de como la superficie este embebida en \mathbb R^3 . La relación de esto con el 5º postulado esta relacionado con el hecho de que en una superficie curva las geodésicas (curvas de longitud mínima), que juegan el papel de las rectas en esa superficie no cumplen en general dicho postulado. Por ejemplo en la esfera por un punto exterior a una recta (círculo máximo) pasa un número infinito de rectas.

Los capítulos 7 y 8 están dedicados a Riemann. En el aspecto sociológico es muy interesante leer como Alemania no había sido gran cosa en matemáticas hasta el siglo XIX y cómo la inversión económica cambió eso para sorpresa del resto de países. Hoy día se asocia a Alemania con la matemática y la física y se piensa que siempre han sido buenos en esos asuntos. Pero según cuentan en el libro eso surgió a raíz de disputas territoriales entre las incipientes universidades de la época, en particular Gotinga (famosa mas tarde, en el siglo XX, cómo cuna de muchos de los padres de la mecánica cuántica) y Berlín.

Riemman generalizó los resultados de Gauss para dimensiones superiores. Cuando la variedad tiene mas de dos dimensiones se puede considerar las curvaturas de los diversos planos bidimensionales en esa superficie. Eso da lugar a un tensor, el tensor de Riemann.

El porque en este libro se tratan tanto asuntos geométricos, cuando la conjetura de Poincaré es un tema de características topológicas, es que la prueba de esa conjetura usa el tensor de Ricci, que es una contracción del tensor de Riemann Estos temas suelen ser bien conocidos por los físicos, al menos los teóricos, debido a la conexión entre estas geometrías y la relatividad general. Son también temas que han sido tratados extensamente en diversos libros de divulgación. Es por eso que no me he extendido demasiado en las explicaciones técnicas. A partir de aquí, que es dónde empieza la parte esencial, seré mas detallado.

Los capítulos 9 y 10 están dedicados a Poincaré, y en parte a Kleín. Como siempre la parte histórico/social es excelente. En la parte matemática nos cuenta, entre otras cosas, cómo Poincaré sentó las bases de la topología, creando además algunas herramientas fundamentales para el estudio de esas propiedades. Una vez conocidas esas bases se explica en que consiste la conjetura. Siendo esta la parte fundamental del tema entraré aquí a dar esas nociones matemáticas en una forma técnica. Realmente el libro se queda a un nivel divulgativo. No sé realmente cuanto podrá apreciar un lector sin cualificación matemática a partir de esa exposición. Dado que soy estudiante de matemáticas y que además me dedico a la teoría de cuerdas mis conocimientos en geometría diferencial y en topologia son relativamente buenos y sé lo que esta intentando en estos capítulos. Realmente la parte que para mi resulta novedosa es la que viene en los capítulos siguientes. No obstante no todos los físicos están familiarizados con la topología así que confío en que les puede resultar útil la introducción somera que haré sobre esta disciplina a partir de ahora.

Primero empezaré explicando que entiende un matemático por una topología.

Las nociones de continuidad en cálculo se suelen dar en términos de epsilones y deltas, pero eso en esencia es hablar de entornos abiertos de la recta real, y el caso es que si uno lo analiza uno usa sólo 3 propiedades básicas de los abiertos.

Una topología es recoger esas tres propiedades y convertirlas en axiomas.

Sea X un conjunto y sea Y={Xn} una colección finita o infinita de subconjuntos de X, X e Y forman un espacio topológico si
i. el conjunto vacío e Y pertenecen a Y
ii. Cualquier subcolección finita o infinita {Zn} de Xn tiene la propiedad de que la unión de todos los Zn pertenece a Y
iii. Cualquier subcolección finita {Zm} de los Xn tiene la propiedad de que su intersección pertenece a Y.

Los Xn son los abiertos de esa topología. Conviene hacer una pequeña distinción, que no siempre se explica en los libros de topologia/geometría para físicos. Los intervalos epsilón y deltas del cálculo de una varible, y sus generalizaciones elmentales, los discos abiertos de radio epsilon/delta en el plano, las bolas abiertas en tres dimensiones, etc, son un tipo especial de abiertos, pero, ciertamente, hay conjuntos que son abiertos y no son de esa forma. Esos subconjuntos especiales de la topología forman una base de la misma.

Bien, una vez que tenemos definidos los abiertos cualquier definición que hagamos en términos de esos conjuntos va a ser una definición topológica. Por ejemplo se dice que un conjunto es cerrado cuando su complementario es abierto. Otra noción topologica de interés (en particular necesaria para formular la conjetura) es la de compacidad. Intuitivamente en \mathbb R^n un compacto va a ser un conjunto cerrado y acotado (la distancia entre dos cualesquiera de sus puntos es finita). Pero esa no es realmente la definición de compacidad. Se puede usar esa definición (de hecho en algunos sitios se hace así) pues el teorema de Heine-Borel nos dice que todo conjunto cerrado y acotado en \mathbb R^n es compacto. Pero como dije una noción topológica debe darse en términos de los abiertos. Vamos a ello.

Primero debo explicar la idea de recubrimiento. Dado un subconjunto, S, de un espacio topológico, X un recubrimiento de S es una colección de conjuntos abiertos Rn tal que S esta incluido en la unión de todos los Rn. Se dirá que un conjunto es compacto cuando todo recubrimiento del mismo admite un subrecubrimiento (un cubrimiento con un un subconjunto de la colección recubridora)finito. La noción de compacidad es útil por muy diversos motivos. Una es que, por el teorema de Heine-Borel, podemos caracterizar los cerrados y acotados, un tipo de conjuntos interesante, mediante esta propiedad.Oto aspecto útil es que si queremos demostrar algo sobre un compacto nos basta demostrarlo sobre cualquier elemento del conjunto recubridor y asegurarnos de que la propiedad demostrada no se pierde cuando tenemos una unión finita de esos elementos. Es importante hacer notar que como en un compacto todos los recubrimientos admiten subrecubrimiento finito podemos elegir los Rn de la forma que mas nos convenga.

Tan importante es la noción de compacidad que la mayoria de resultados toopológicos van a estar referidos a espacios compactos. Los no compactos son mucho mas difíciles de estudiar.

Antes de seguir con tecnicismo haré una aclaración importante. Quienes hayan leído en algún libro de divulgación sobre topología lo mas probable es que se la hayan definido algo así como “geometría de las superficies de goma”, o el estudio de las propiedades que se mantienen bajo operaciones de estirar/contraer y de identificar. Eso se parece muy poco a lo que he explicado hasta ahora. El caso es que conviene distinguir dos aspectos de la topologia, Por un lado esta la topologia de conjuntos. Al generalizar las propiedades de los abiertos usados en las definiciones de cálculo nos permite formalizar el mismo y extenderlo a espacios abstractos. Esto es útil para dar un marco común a todas las ramas de las matemáticas. Estas nociones de topologia de conjuntos son fundamentales en las definiciones que se hacen en conceptos relacionados con teoría de la medida, análisis funcional, etc. Y por supuesto también son esenciales en definiciones de geometría (tanto diferencial cómo algebraica). Por otro lado tenemos otro aspecto, que enlaza con la definición dada en los textos divulgativos. Nos va a interesar poder conocer cuando dos espacios son indistinguibles entre si a partir exclusivamente de sus propiedades topológicas.Pues bien, esos espacios equivalentes topologicamente se corresponden a la noción intuitiva de estirar/contraer e identificar. Enseguida veremos la definición técnica de estos conceptos.

Había dicho que la introducción de una topología permitía definir el concepto de función continua de forma abstracta. Vamos con esa definición. Una función f:M->N entre dos espacios topológicos se dice continua si la imagen inversa de un abierto de N es un abierto de M. Sóo con esto se puede dar una definición rigurosa de la idea de que dos espacios son deformables el uno en el otro, es decir topológicamente equivalentes. Dos espacios son topologicamente equivalentes, homeomorfos, cuando existe entre ellos una aplicación continua y con inversa continua, tal aplicación se dice que es un homeomorfismo.(Normalmente se añade la condición de que esa aplicación sea biyectiva). Lo interesante de esto es que si dos espacios son homeomorfos van a tener las mismas propiedades topológicas.

Y tenemos casi todos los conceptos involucrados en el enunciado de la conjetura. Vamos a por los que nos faltan.

Una noción topológica es la de espacio conexo, intuitivamente un espacio es conexo cuando no esta hecho de varias partes separadas.Por ejemplo R 2 sería conexo, un círculo en el plano sería conexo. Sin embargo dos círculos sin puntos en común, por ejemplo círculos de radio uno con centro en (-5.0) y (0,5) no lo serían.

La definición rigurosa de este concepto es:

Un espacio topológico X es conexo si no puede ser escrito cómo X = X1 U X2 dónde X1,X2 son ambos abiertos y X1 Int X2 = Conjunto vacío.

Es fácil probar, no lo haré, que esta definición es “topológica”, es decir que dos espacios, uno conexo y otro no, no pueden ser homeomorfos.Hay más definiciones referentes a la conectividad, conexo por arcos, etc. Pero con esta nos vale.

Nos falta ir un pequeño paso más allá de la mera noción de conexo para poder enunciar la conjetura de Poincaré. Necesitamos explicar que es un conjunto simplemente conexo. Eso requiere entrar en el tema de la homotopía. Para exponer esto voy a seguir el esquema de la wiki, más que nada para aprovechar algunas fotos.

Dos aplicaciones continuas (entre dos espacios topológicos X, e Y) f,g:X ->Y se dicen homotópicas si existe otra aplicación (continua también) H: X x [0,1] -> Y (la x hace referencia al producto cartesiano, [0,1] es el intervalo unidad cerrado) tal que:

H(x,0)=f(x)
H(x,1)=g(x)

Un ejemplo importante es considerar las diferentes clases (homotópicas) de mapas del círculo, S^1, a un espacio X:

S^1 \rightarrow X

la estructura resultante es el importantísimo grupo fundamental. Es este grupo el que nos permitirá definir lo que es un espacio simplemente conexo.

Mas formalmente el mapa de un círculo en un espacio topológico la podemos dar mediante la idea de lazo.

Sea X un espacio topológico, y p un punto fijo de X. Un lazo con base en p es una aplicación continua que verifica γ(0) = γ(1) = p.

El producto α * β de dos lazos α y β se define como . Esto es, el lazo α * β primero recorre el camino de α, pero a “doble velocidad” y después el de β, también a doble velocidad.

Esto nos lleva al concepto de clases de homotopía de lazos, y de ahí al grupo fundamental.

as clases de homotopía son las clases de equivalencia debidas a la relación de ser homotópico. Dos lazos con base en un punto común p son homotópicos si existe una aplicación continua H:[01]x[0,1] ->X tal que

H(s,0)=\alpha (s)
H(s,1)=\beta (s)
H(0,t)=p

El producto de dos clases de homotopía de lazos [f] y [g] se define como [f ∗ g]. Puede demostrarse que este producto está bien definido al ser independiente de la elección de representantes. Este producto nos permite obtener una estructura de grupo (véase la entrada anterior del blog para una introducción a la teoría de grupos): el elemento neutro será la clase [γ] del lazo trivial definido como γ(t) = p para todo t; el inverso de la clase de un lazo [f] será la clase del mismo lazo recorrido en sentido contrario (es decir, f − 1(t) = f(1 − t))

El grupo fundamental de un espacio topológico X basado en un punto p \in X , notado como \pi_1(X,p) , es el conjunto de clases de homotopía de curvas cerradas con la operación yuxtaponer clases. El subíndice 1 en el pi hace referencia a que existen otros grupos de homotopía. La definición del grupo n-ésimo de homotopia sigue la misma pauta, sustituyendo el círculo por la n-esfera. Siendo útiles hay que decir que el grupo mas importante es, con diferencia, el primero, de ahí lo de fundamental. Aquí he definido este grupo. En los cursos introductorios de topologia se suelen dar algunas técnicas elementales para el cálculo del mismo. También en esos cursos se suele mencionar un aspecto importante de este grupo. Dos espacios que tienen el mismo grupo de homotopía se dice que son homotopicamente equivalentes. Se cumple, además, que si dos espacios son homeomorfos son homotópicos, pero no a la inversa. Justo esa falla de que dos espacios homotopicos no sean necesariamente homeomorfos es la que esta detrás de que la conjetura de Poincaré no sea una trivialidad.

Este grupo de homotopía nos va a permitir definir la noción de conexidad simple que aparece en el enunciado de la conjetura. Un espacio se dice simplemente conexo si su grupo fundamental es trivial. Intuitivamente esto significa que cualquier curva cerrada en el espacio es homotópica (contractible) a un punto.

Bien, con esto ya he explicado todas las nociones implicadas en la conjetura que dí al inicio del post. En otra entrada explicaré cómo se demostró la misma, dando definiciones técnicas de algunos de los conceptos que en el libro vienen explicados de manera intuitiva. Mi intención era haber explicado todo de una sola vez, pero para ello tendría que renunciar a unos mínimos de rigor explicativo o hacer un post excesivamente largo, opciones ambas que no me parecen oportunas.

Aunque volveré sobre el libro en la siguiente entrada dedicada al tema no concluiré esta sin aclarar que en los capítulos subsiguientes el autor hace un buen trabajo exponiendo las ideas que llevaron a la demostración. También da apuntes sociológicos (de algunos de los cuales el autor fue testigo de primera mano) relacionados con el desarrollo de la topología en el siglo XX. Con todo ello estamos ante un libro excelente en el terreno matemático y mas excelente aún en el terreno de sociología e historia de la matemática. Eso sí, en este blog comenté, en el post, “El reto de Fermat”, otro libro-titulado igual que el post- dedicado a otro gran problema matemático recientemente, la conjetura de Fermat. Ese libro, también excelente, entraba en bastantes mas tecnicismos que este. Tal vez algunos lectores con una buena formación matemática, pero que no saben nada sobre la conjetura, y que puede que no sean expertos en topologia, echen de menos un libro de esas características. Pero eso no le quita un ápice de mérito al libro de O’Shea. Simplemente deja abierto el camino a que otro autor haga otro tipo de libro sobre la conjetura.

Por cierto, llevo ya varios post con primeras partes sobre temas diversos. Intentaré ir poniendo las correspondientes continuaciones.

Anuncios

Teoría de grupos y física I: conceptos básicos

junio 3, 2009

Una de las ramas de la matemática cuyo uso en física es fundamental es la teoría de grupos, en particular la teoría de grupos de Lie. Reflejo de esa importancia es que el modelo standard de partículas, la teoría sobre la naturaleza mas sofisticada y fundamental sobre la naturaleza que esta verificada experimentalmente se conoce, incluso en los libros de divulgación cómo SU(3)xSU(2)xU(1). Y en esos mismos libros de divulgación posiblemente se habrá podido leer de modelos de gran unificación tipo SU(5) ó SO(10). Aparte esta el hecho de que formalmente todas las partículas del modelo standard pertenecen a representaciones del grupo de Lorentz. En este post (y los que le siguen) intentaré explicar que significan, y que utilidad tienen, esos símbolos.

Antes de eso, no obstante, señalar que pese a su importancia la teoría de grupos no siempre se enseña en una licenciatura de físicas, incluso en al especialidad de teórica. Por ejemplo, ahora mismo, en el plan actual de la UAM esta ausente. Ciertamente casi cualquier estudiante de físicas sabrá, una vez cumplimentado en primer curso el correspondiente curso de álgebra lineal, que SU(2) es el grupo de matrices unitarias especiales de dimensión 2, pero, ciertamente de saber eso a entender su uso en teoría cuántica de campos media un pequeño abismo.

Eso sí, a lo largo de los estudios la gente habrá oído comentar varias veces que tal o cuál cosa de mecánica cuántica (no relativista) se puede explicar de una manera mas elegante mediante grupos. Eso incluye cosas cómo el momento angular, los coeficientes de Clebs-Gordon y alguna cosa más. Posiblemente alguno se ha quedado con ganas de ver algo sobre el tema. Intentaré ver algo al respecto, pero me centraré mas en los usos de la teoría en física de partículas.

Una última puntualización antes de entrar en materia. La forma de ver exponer la teoría de grupos varia mucho de los textos escritos para físicos a los textos escritos para matemáticos. En este post expondré los resultados en el estilo de los físicos de modo que pueda leerlo el mayor número posible de gente. Pero, aparte, comentaré la forma en que se ven esos conceptos en la literatura matemática para que cualquier con un bagaje en matemática moderna pueda ver la forma “verdadera” de dichos conceptos. Eso sí, asumiré que ese lector matemático ya conoce topologia, geometría diferencial en variedades y cosas así.

Empecemos ya con la materia. Un grupo (G, .) es un conjunto de elementos en los que se introduce una operación interna, que denotaré por un punto “.” (ocasionalmente usaré el signo + para esa operación en los lugares dónde su uso sea mas natural), que cumple las siguientes propiedades:

i) Asociativa: a.(b.c)=(a.b).c \forall ~a,b,c \in~G
ii) Elemento identidad: \exists ~ e~ t.q. ~ e.a=a.e ~\forall a \in G
iii) Elemento inverso: \forall a \in G \exists ~ a^{-1} ~ t.q.~ a.a^{-1}=a^{-1}.a=e

Si además la operación “.” cumple la propiedad conmutativa se dirá que el grupo es Abeliano.

Vamos a ver algunos ejemplos:

(\mathbb Z,+) , el conjunto de números enteros con la suma usual, es un grupo abeliano; donde el elemento neutro es el 0, y el simétrico de x, es -x.
(\mathbb Z_n,.) Grupo cíclico de orden n. Es el grupo generado por un único elemento a y sus potencias hasta orden n. Esta última es la identidad, esto es {a,a^2, a^3,...,a^n=e}. No entraré en muchos detalles sobre este grupo. En el caso mas sencillo dónde los elementos del conjunto son números enteros los generadores del grupo son los enteros que son primos relativos con n. De hecho puede demostrarse que todos los otros casos son equivalentes (isomorfos) a este. Sin embargo este tipo de grupos aparecen de manera abstracta en, por ejemplo construcciones topológicas como la homotopia o la homologia.

Estos dos ejemplos anteriores son grupos discretos, es decir, el conjunto G tiene un número finito de elementos. Aunque son interesantes en si mismos y útiles en varias ramas de la matemática y la física nos va a interesar mas el caso de los grupos continuos, es decir, aquellos en los que el conjunto G tiene un número infinito (no numerable) de elementos. Ejemplos de estos grupos van a ser los que aparecían al principio, los U(n), SU(n), SO(n), etc .

Grupo unitario U(n): Conjunto de las matrices unitarias nxn, con la operación “.” el producto de matrices. Es decir, las matrices que cumplen U^{\dagger}.U=U^{\dagger}.U=\mathbb I . Para n>1es no abeliano. Sin embargo U(1) es abeliano. Se corresponde a las transformaciones de fase e^{i\theta}.

Grupo especial unitario SU(n): Grupo de las matrices unitarias con determinante unidad.

Grupo ortogonal SO(n): grupo de la matrices ortogonales, es decir, que cumplen A.A^T=A ^T.A=\mathbb I .

Voy a detenerme un poco en este último grupo porque nos va a permitir ver el motivo por el cuál los grupos son importantes en física. En los cursos de álgebra lineal elemental se muestra cómo las operaciones geométricas de girar un vector por un ángulo \theta se corresponde con una matriz ortogonal de dimensión 2: \left( \begin{array}{cc} cos{\theta} & -sen{\theta}  \\ sen{\theta} & cos{\theta} \end{array} \right)

Pues bien, esta matriz se puede ver que es, para cualquier valor de \theta un elemento de SO(2). Igualmente las matrices de SO(3) se corresponden a la operación geométrica de giros (Si quisiéramos incluir reflexiones tendríamos que permitir matrices con determinante -1 y tendríamos el grupo O(n)). En física hay muchos problemas que tiene simetría rotacional, es decir, que el problema no cambia si el conjunto de todas las partículas y/o campos involucradas en el problema son sometidos a una rotación. Esto nos da ya una idea de la íntima relación que va a haber entre grupos continuos y física.

Un poco mas formalmente puede decirse que los grupos de rotaciones son los grupos que dejan invariante el producto escalar de dos vectores. Este producto viene definido por una métrica. Los grupos SO(n) se corresponden a la métrica usual en \mathbb R^n . Antes hablé del grupo de Lorentz. Este es el análogo al grupo SO(n) cuando en R ^4 se tiene, en vez de la métrica euclidea usual, la métrica de Lorentz, i.e. la métrica diag (-1,1,1,1). Se suele denotar el grupo de Lorentz mediante la notación SO(3,1). Si además de rotaciones permitimos traslaciones hablamos del grupo euclideo para el caso de la métrica usual y del grupo de Poincaré para la métrica de Lorentz.

Voy a hacer un pequeño inciso destinado a los matemáticos. En física la mayoría de grupos continuos van a ser grupos matriciales y por “continuo” puede entenderse, hablando vagamente, que los elementos de cada matriz posible van a estar determinados por unos ciertos parámetros. Es decir, que los elementos de la matriz van a ser funciones de un cierto número de variables y la continuidad del grupo viene a decir que esas funciones son funciones continuas (entendidas como funciones de variable real).

En matemáticas se quiere tener una definición general mas abstracta. Para ello se introduce el concepto de grupo topológico. Un grupo topológico es un grupo en el que el conjunto G es un espacio topológico. Se exige, además, que las operaciones de grupo sean compatibles con la topología, es decir que la multiplicación del grupo G × G -> G y la operación de inversión G -> G sean aplicaciones continuas. Aquí, G × G es visto como un espacio topológico con la topología producto.

De hecho se suele ir un paso más allá. En física interesan los grupos de Lie. Estos aparte de continuos deben ser diferenciables. Esto nos lleva, en terminología moderna, a decir que un grupo de Lie es una variedad diferencial en las que operaciones de grupo son funciones \mathbb C^\infty. Mas adelante introduciré la noción de álgebra de Lie en términos matriciales. Anticipar que en términos matemáticos el álgebra de Lie se corresponderá con el conjunto de los vectores invariantes por la izquierda bajo la acción del grupo, que, en última instancia puede verse que se corresponde con el espacio tangente en la identidad.

Sigamos, tras ese paréntesis para matemáticos, con algunas nociones más.

Dados dos grupos G=(g1,g2,…} y H={h1,h2,….} se define su producto directo GxH= {g_ih_i} con la ley de multiplicación g_kh_l.g_mh_n=g_kg_m.h_lh_m

Esto ya nos permite entender la notación usada al principio cuando decíamos que el modelo standard es SU(3)xSU(2)xU(1). Ciertamente entender plenamente el significado de esa notación es mucho mas complicado que todo lo visto hasta ahora, pero, en esencia, es lo que he puesto antes, el producto directo de esos grupos.

Saber si un grupo dado puede o no escribirse como producto de otros grupos es algo importante. Para poder estudiar eso vamos a introducir otro concepto, el subgrupo invariante.

Un subconjunto N de un grupo G es un subgrupo invariante de G si \forall t~ \in ~ N ~ r.t.r^{-1} ~ \in ~ N . Es decir, que la operación de multiplicar un elemento de N por cualquier elemento de G no nos saca de N. Se ve trivialmente que cualquier componente en un producto directo de grupos es un subgrupo invariante del grupo producto. Se dice que un grupo que no contiene ningún subgrupo invariante es un grupo simple. SU(n) es un grupo simple. U(n), por el contrario, no lo es. Puede verse que U(n) se puede descomponer en el producto SU(n) xU(1). Dada la relevancia de U(1) se introduce un concepto mas. Se dice que un subgrupo es semisimple cuando puede escribirse como producto de otros grupos mas sencillos ningunos de los cuales es U(1). Según esto U(n) no sería un grupo semisimple.

Para concluir este post voy a introducir brevemente un concepto más, de capital importancia, la representación de un grupo. Una representación es la realización de los elementos del grupo como matrices.

En el caso de los grupos que en su definición ya interviene el concepto de matriz (SU(n), O(n), U(n), etc) sto no parece aportar nada especial. En el caso de otros grupos, como el caso de los grupos finitos, esto si tiene su utilidad. No obstante es muy importante dejar claro que incluso en los grupos cuya definición se hace en términos de matrices tiene sentido hablar de representaciones. Veamos porque.

Pensemos en SO(3) . En su definición viene dado por matrices 3×3 que actúan sobre vectores de dimensión 3. En mecánica clásica tenemos una magnitud física, el momento angular, que esta definida para sistemas que tiene invarianza bajo rotaciones. La expresión convencional para el momento angular es \vec L=\vec r x \vec p . En cuántica el radio r y el momento lineal p se sustituyen por los correspondientes operador posición y operador momento. Análogamente se introduce el operador momento angular \hat L=\hat r x \hat p .

Clasicamente el momento angular puede tomar cualquier valor. Sin embargo cuánticamente el operador momento angular (al menos para ciertos sistemas, como los estados ligados del átomo de hidrógeno) puede verse que va a tomar una serie discreta de valores. Más aún, clasicamente pueden medirse simultáneamente el valor del momento angular total L (o su cuadrado) y todos las componentes, (Lx, Ly, Lz), del momento angular. Cuanticamente sin embargo los operadores Li aunque conmutan con el operador L ^2 no conmutan entre sí y por tanto no pueden medirse simultáneamente sus valores (normalmente, por convenio se opta por medir Lz). Esto nos lleva a que tendremos que caracterizar los estados en términos de (L^2 ,Lz) . Esto nos lleva a que tendremos los autoestados caracterizados por valores (l, m) dónde l es el autovalor respecto a L^2 y m el autovalor respecto a Lz. Se puede demostrar, además, que si los valores posibles de m para un l dado son m={l, l-1, l-2,….,0, -(l-1), -(l-2), …,- l}.

Tal vez el lector se haya despistado un poco con la física de los párrafos precedentes y se pregunte su relación con as representaciones. Pasemos a aclararlo. Actuando sobre funciones arbitrarias el operador L esta definido en términos de los operadores r y p, según dijimos antes. Sin embargo si nos restringimos a autofunciones con momento angular y tercera componente angular bien definidos podremos representar L^2 y los Li mediante matrices nxn. Aquí la dimensión n estará relacionada con el autovalor l. En concreto será el número de valores posibles de m para un l dado. Así, para l=0 tenemos un sólo valor posible. Para l=1 tenemos 3, para l=2 tenemos 5 y, en general n= 2l + 1. Según esto para estados de momento l=1 el grupos SO(3) vendría representado por matrices 3×3, para l=2 por matrices 5×5, etc. En realidad en cuántica en vez de SO(3) se va a tomar su grupo recubridor, que es SU(2) y las cosas son ligeramente diferentes. Más aun, estrictamente el momento angular esta asociado a los generadores infinitesimales del grupo de Lie (su álgebra de Lie). De hecho lo que en última instancia se estudia son las representaciones de ese álgebra, que generan las representaciones del grupo. No obstante se suele referir a la representación del álgebra como la representación del grupo sin hacer mayor distinción. No ahondare en estos conceptos ahora, lo pospondré para posts venideros.

En física de partículas las cosas van a ser ligeramente diferentes. Los grupos SU(n) se van a corresponder no a simetrías externas globales sino a simetrías internas locales. Asociados a esos grupos van a estar los bosones vectoriales. En el caso U(1), correspondiente al electromagnetismo, ese bosón vectorial es el fotón, mediador de la interacción electromagnética. En el caso de SU(3) esos bosones serán los gluones, mediadores de la interacción nuclear fuerte.

Veremos que los bosones vectoriales estarán asociados a una representación específica de esos grupos, la representación que los define (conocida como representación adjunta). Físicamente los bosones interactuan con fermiones cargados bajo ese grupo de simetría. Así los fotones interactuan con electrones con carga eléctrica y los gluones sobre quarks que (aparte de carga eléctrica, irrelevante para lo que aquí quiero mostrar) tienen carga bajo SU(2), conocida como carga de color.

En términos matemáticos tenemos que los fermiones van a ser algo así como los vectores sobre los que actúan las matrices. Para aquellos con un cierto nivel en matemáticas decir que las teorías gauge se corresponden a conexiones en fibrados principales y que los fermiones se corresponden a fibrados vectoriales asociados.

En pos ulteriores iré aclarando más que significan todas estas cosas. Introduciré el concepto de suma directa de representaciones y así podré explicar el significado de expresiones del tipo:

(2×2)x2=(3+1)x2=(3×2)+(1×2)=4+2+2

Pero eso será en otro post. El tema de la teoría de grupos es extenso y difícilmente pueden condensarse en una única entrada todos sus aspectos relevantes.