Posts Tagged ‘topología’

Una guía compacta a la compactificación

diciembre 30, 2016

En su momento escribí una entrada sobre la forma mas básica de compactificación, la teoría de Kaluz-Klein. Sí se quieren mas detalles (en especial cómo aparece, y que papel juega el dilatón) de los que vienen en esa entrada se puede consultar, por ejemplo, la correspondiente entrada de la wikipedia inglesa Kaluza–Klein theory.

Bien, voy a intentar avanzar un poco más respecto a lo que ahí viene y dar una idea un poco global de cómo es el proceso de compactificación. Al intentar dar una idea global dejaré de lado bastantes detalles técnicos, pero tampoco va a ser a nivel de un libro de divulgación para legos sino mas bien en la línea de la entrada anterior.

El siguiente paso, una vez tenemos una teoría guague abeliana U(1), es intentar obtener una teoría no abeliana, para lo cuál vamos a necesitar mas de una dimensión adicional, usando la notación de la entrada anterior descomponemos la métrica en la forma:

g_{MN}= \begin{pmatrix} \eta_{\mu \nu } & \\ & g_{\alpha \beta (y))} \end{pmatrix}

Recordemos que M y N son índices que recorren todas las dimensiones, mu y nu recorren sólo las 4 dimensiones usuales, eta es la métrica de Minkowsky e y denota las coordenadas en las dimensiones extra.

Asumimos que esta métrica es una solución a las ecuaciones de Einstein para el vacío R{MN}=0 o bien, sí permitimos una contaste cosmológica

R_{MN} - \frac{1}{2}Rg_{MN} + \Lambda g_{MN}=0

En el caso de una sóla dimensión adicional la compactificación era única, convertir el eje y en un círculo, ahora tenemos mucha mas libertad. Sí tenemos D dimensiones extra y plegamos cada uno de los ejes coordenados en un círculo tendremos un D-toro (recordemos que el 2-toro tiene forma de “donut” hueco, o de neumático) y, en ése caso, la gravedad de las dimensiones extra se verá cómo una teoría gauge [U(1)]^D. Mas adelante explicaré cómo se obtiene ese D-toro, pero de momento entendamos bien lo que hemos hecho. Cuando las dimensiones extra están descompactificadas ahí opera la simetría del grupo de difeormorfismos de esas dimensiones extra, que es muy grande. Al reducir esas dimensiones a la forma de un D-toro esa simetría de difeomorfismos se ha visto muy reducida, a ese [U(1)]^D. Digamos que el grupo de isommetrías de la dimensión compactificada se ve cómo una teoría gauge con esa misma simetría en las 4 dimensiones.

Cuando las dimensiones extra se compactifican a una geometría mas compleja que un D-toro y no es nada sencillo ver las isometrías de ese espacio. Voy a entrar un poco en algunos detalles matemáticos, elementales, pero que no siempre se comentan en los libros de física sobre el proceso de compactificación (sobre los detalles de las isomerías hablaré en otra entrada). Lo primero es el origen del término “compactificar”. Hace referencia al concepto topológico de espacio compacto. Lo escribí en la entrada que dediqué a un libro sobre la conjetura de Poincaré pero lo reescribiré aquí, para hacer ésto mas autocontenido.

Las nociones de continuidad en cálculo se suelen dar en términos de epsilones y deltas, pero eso en esencia es hablar de entornos abiertos de la recta real, y el caso es que si uno lo analiza uno usa sólo 3 propiedades básicas de los abiertos.

Una topología es recoger esas tres propiedades y convertirlas en axiomas.

Sea X un conjunto y sea Y={Xn} una colección finita o infinita de subconjuntos de X, X e Y forman un espacio topológico si
i. el conjunto vacío e Y pertenecen a Y
ii. Cualquier subcolección finita o infinita {Zn} de Xn tiene la propiedad de que la unión de todos los Zn pertenece a Y
iii. Cualquier subcolección finita {Zm} de los Xn tiene la propiedad de que su intersección pertenece a Y.

Los Xn son los abiertos de esa topología. Conviene hacer una pequeña distinción, que no siempre se explica en los libros de topologia/geometría para físicos. Los intervalos epsilón y deltas del cálculo de una varible, y sus generalizaciones elmentales, los discos abiertos de radio epsilon/delta en el plano, las bolas abiertas en tres dimensiones, etc, son un tipo especial de abiertos, pero, ciertamente, hay conjuntos que son abiertos y no son de esa forma. Esos subconjuntos especiales de la topología forman una base de la misma.

Bien, una vez que tenemos definidos los abiertos cualquier definición que hagamos en términos de esos conjuntos va a ser una definición topológica. Por ejemplo se dice que un conjunto es cerrado cuando su complementario es abierto. Otra noción topologica de interés es la de compacidad. Intuitivamente en \mathbb{R} un compacto va a ser un conjunto cerrado y acotado (la distancia entre dos cualesquiera de sus puntos es finita).

Pero como dije una noción topológica debe darse en términos de los abiertos. Vamos a ello.

Primero debo explicar la idea de recubrimiento. Dado un subconjunto, S, de un espacio topológico, X un recubrimiento de S es una colección de conjuntos abiertos Rn tal que S esta incluido en la unión de todos los Rn. Se dirá que un conjunto es compacto cuando todo recubrimiento del mismo admite un subrecubrimiento (un cubrimiento con un un subconjunto de la colección recubridora)finito. La noción de compacidad es útil por muy diversos motivos. Una es que, por el teorema de Heine-Borel, podemos caracterizar los cerrados y acotados, un tipo de conjuntos interesante, mediante esta propiedad.Oto aspecto útil es que si queremos demostrar algo sobre un compacto nos basta demostrarlo sobre cualquier elemento del conjunto recubridor y asegurarnos de que la propiedad demostrada no se pierde cuando tenemos una unión finita de esos elementos. Es importante hacer notar que como en un compacto todos los recubrimientos admiten subrecubrimiento finito podemos elegir los Rn de la forma que mas nos convenga.

Tan importante es la noción de compacidad que la mayoría de resultados toopológicos van a estar referidos a espacios compactos. Los no compactos son mucho mas difíciles de estudiar.

Entonces la idea de la compactificación es coger un conjunto que no es compacto, por ejemplo la recta real, que no es acotada, y por tanto, según el teorema de Heine-Borel no es compacta, y convertirla en un conjunto compacto por un procedimiento bien definido, en este caso identificar los dos puntos del infinito a la “izquierda” y “derecha”. Sí cogemos un folio e identificamos dos lados opuestos obtenemos la superficie de un cilindro (sin las tapas). Sí en ese cilindro resultante identificamos los dos círculos opuestos obtenemos un 2-toro.

ES interesante que, en el caso anterior, tanto el folio (un rectángulo con sus lados incluidos) cómo el toro son compactos así que aquí no estaría del todo justificado el término “compactificación”. Pero sí nos imaginamos que el rectángulo es infinito, es decir, es el plano real, entonces sí estamos convirtiendo ese plano, que no es compacto, en un toro, que es compacto. Realmente el proceso de compactificación de un rectángulo aunque no cambia la compacidad del rectángulo si cambia otras propiedades topológicas del mismo, por ejemplo la conectividad por arcos (la explico en la entrada sobre la conjetura de Poincaré). El rectángulo es contractible (cualquier círculo que dibuje dentro del mismo se puede contraer a un punto sin salirse del rectángulo) mientras que en el toro no es así (de hecho hay dos familias de círculos que no pueden contreaerse a un punto). No daré mas detalles sobre ésto ahora (en el post sobre la conjetura de Poincaré comento más al respecto) pero no deja de ser un hecho interesante, que tiene muchas implicaciones en topología y en física.

Uno, bastante conocido, es que, en teoría de cuerdas, en particular para la cuerda heterótica compactificada en un Calabi-Yau, el número de generaciones de partículas es igual a la mitad de la característica de Euler-Poincaré de el espacio de compactificación M &latex\frac{1}{2}\chi (M))$. Esta constante apareció por primera vez en el trabajo sobre teoría grafos que hizo Euler para, entre otras cosas, resolver el problema de los puentes de Königsberg. Para un grafo la expresión de la característica de Euler es \chi= C - A +V donde C, A y V son los números de caras, de aristas y de vértices respectivamente.

Cómo una superficie puede ser triangulada se puede definir esa constante en términos de la constante de Euler de la triangulación de la misma. No obstante, para una superficie, o una variedad n-dimensional, es mejor definir la constante en términos de los grupos de homología o cohomología. Primero se define el n-ésimo número de Betti &latex b_n$ cómo el rango del n-ésimo grupo de homología. En términos de esos números la característica de ÇEuler es la suma alternada de los números de Betti, es decir, tiene la expresión \chi =\sum_{i=0}^{n} (-1)^{i}b_i. También, mediante la dualidad de Poincaré, se podría escribir en términos de grupos de cohomología, así cómo en otras formas mas sofisticadas, pero éso ya sería irnos demasiado del propósito de la entrada.

Otro ejemplo es el uso de “Wilson loops” (o Wilson lines), osea, holonomías sobre círculos, que cuando el espacio no es conexo por arcos pueden usarse para reducir la simetría de un grupo gauge de una manera diferente al mecanismo de Higgs. Este procedimiento se usa de manera habitual en la fenomenología de la cuerda heterótica.

Por cierto, el plano real puede ser compactificado de manera natural de más de una forma. Un proceso muy típico sería la compactificación por un punto, el punto del infinito, es decir, cogemos todos las regiones del plano que “están en el infinito” y las convertimos en un punto. El espacio resultante sería una esfera. Es un proceso algo mas complejo de visualizar, y para ayudar a entenderlo vendría bien que explicase la proyección estereográfica, pero espero que con esta imagen os hagáis una idea aproximada.

Al inicio de la entrada mencioné que iba a explicar cómo surgía el D-toro al compactificar cada una de las dimensiones extra a un círculo. Hasta ahora he explicado cómo obtener el toro identificando los lados opuestos de un cuadrado, pero ahí no se ve cómo surge a partir de círculos.

Bien, éso requiere el concepto de producto cartesiano de dos espacios topológicos. Sí tenemos dos espacios topológicos X1 y X2 su producto cartesiano es el conjunto X1xX2={x1,x2}, es decir, el conjunto de pares dónde el primer par, x1, es un elemento de el conjunto X1 y el segundo, x2, es un elemento del conjunto X”. A partir de una base de las topología de X1 y X2 se puede formar una base de la topologia producto tomando el conjunto de todos los pares ordenados posibles formados con los elementos base. En caso de que no se haya entendido muy bien este párrafo tampoco pasa nada, que es bastante fácil de visualizar la explicación que daré ahora.

Si tenemos dos círculos S^1 y S^2, el toro es el producto cartesiano de esos dos círculos T^2=S^1xS^2. Intuitivamente podemos pensar que cogemos uno de los círculos y cada uno de los puntos de ese círculo lo hacemos girar 360 grados alrededor de otro círculo perpendicular. Se puede visualizar en el siguiente dibujo bastante bien la idea.

Obviamente un D-toro es la generalización de esa idea, osea, un producto cartesiano de D círculos, cada uno de los cuales se obtiene al compactificar cada uno de los ejes coordenados.

Una definición mas precisa de la topología de identificación requeriría una entrada de un blog por si misma, pero al menos espero que con ésto quede mas claro el origen del término y los ejemplos den una idea de cómo se visualiza.

Formas diferenciales (conceptos básicos), homología y cohomología

julio 5, 2010

Por motivos ajenos a este blog recientemente he tenido que escribir una pequeña introducción informal a la teoría de formas diferenciales. Aprovecho ese trabajo para extenderlo con explicaciones sobre cohomologia y homologia, que son conceptos que surgen de manera natural al tratar las formas diferenciales y su importancia. En este post hago uso libre de los conceptos topológicos que introduje en la entrada que hice sobre la conjetura de Poincaré. De hecho, esta entrada contiene material que usaré en el futuro cuando vuelva a hablar sobre la conjetura de Poincaré. En general el material de esta entrada es de uso ubicuo en física y matemáticas y posiblemente la use de referencia en el futuro en muy diversos temas.

Una forma diferencial puede ser entendida como un operador multilineal antisimétrico definido sobre un espacio vectorial. Dicho de otra forma sería un elemento del producto tensorial antisimetrizado de elementos del espacio dual a un vectorial. Para los propósitos de este post no es necesario dar los detalles algebraicos. Lo interesante es conectar esta definición algebraica con una definición operativa. Si consideramos que tenemos una familia de espacios vectoriales dependientes de unos parámetros continuos podemos tener una forma diferencial definida algebraicamente (a veces se usa el término “forma exterior” para referirse a la construcción algebraica reservándose el término “forma diferencial” para el caso general)) en cada punto. El caso mas sencillo es \mathbb {R}^n considerado como espacio afín. Es decir, que en cada punto de \mathbb {R}^n tenemos un espacio vectorial copia del espacio vectorial en el origen. De ese modo podemos tener una forma diferencial, en el sentido algebraico, en cada punto. Esto define una forma diferencial en \mathbb {R}^n .

Una 0-forma sería simplemente una función. Si la forma pertenece al espacio dual será una 1-forma. Si pertenece al producto tensorial antisimetrizado de dos espacios duales sería una 2-forma, etc.

En \mathbb {R}^n en la práctica esto redunda en una construcción bastante sencilla, como a que puede leerse en, por ejemplo, el libro de Marsden-Tromba de cálculo vectorial. Así una 1-forma es una expresión formal del estilo:

f=f_1(x_1,x_2,..., x_n)dx^1  + f_2(x_1,x_2,..., x_n)dx^2 + .....f_n(x_1,x_2,..., x_n)dx^n

dónde las f_i(x_1,x_2,..., x_n) son funciones arbitrarias de las coordenadas y las dxison una notación para indicar la base del espacio dual de la base canónica de \mathbb {R}^n

Una n- forma sería una expresión del estilo:

\omega=f_{ij...k}dx^i \wedge dx^j .... \wedge dx^k

En esta expresión se ha introducido un elemento nuevo, el producto exterior \wedge . Este producto es una notación para el producto tensorial antisimetrizado . También puede definirse de otro modo, mediante unas propiedades sencillas:
Sea { dx_i } una base de un espacio vectorial V (o de su dual), que a su vez es un espacio vectorial). Un producto exterior, o producto cuña, de dos tales generadores se define exigiendo las reglas de cómputo (relaciones) siguientes:

1.dx_i \wedge dx_j = -dx_j \wedge dx_i \ si \ i \neq j

2. dx_i \wedge dx_i=0

Nota: Como estoy trabajando en \mathbb {R}^n se tiene que la base dual y la base del espacio son isomorfas y que, además, las componentes covariantes y contravariantes de un tensor son las mismas con lo cuá soy ago laxo a la hora de manejar subíndices y superíndices. )

A partir de esa propiedad de producto exterior de las bases puede, por linealidad, obtenerse el producto exterior de dos formas arbitrarias. En \mathbb {R}^3 , dado que el dual de \mathbb {R}^n coincide con el mismo, puede identificarse una 1-forma con un campo vectorial. Y el producto exterior de dos 1-formas puede verificarse que coincide formalmente con el producto vectorial de dos vectores. Eso sí, el producto vectorial de una n-forma y una m-forma es una (n+m) forma. Por tanto el “producto vectorial” de dos 1-formas es una 2-forma, y, por tanto, un objeto diferente a los “vectores” de los que era producto. Sin embargo la identificación funciona porque una 1-forma arbitraria tiene 3 componentes y una 2-forma también (ya que los productos exteriores dx^i\wedge dx^i se anulan) y al tener la misma dimensión, 3, pueden considerarse como “vectores” de dimensión 3.

El otro elemento importante de las formas diferenciales es la derivada exterior. Esta transforma un n-forma diferencial en una (n+1)-forma diferencial. La definición formal no es especialmente complicada. No obstante a efectos prácticos nos basta con la siguiente definición intuitiva:

d\omega= \sum_{i,j...,k,l} \frac{\partial f_{ij...k}}{\partial x^l} dx^l \wedge dx^i \wedge dx^j ... \wedge dx^k

Vamos a enlazar la derivada exterior con los elementos bien conocidos del cálculo vectorial. Si f es una 0-forma (recordemos, una función ordinaria) su derivada exterior es simplemente:

df=\sum_{i=1}^n \frac{\partial f}{\partial x^i} dx^i

Podemos, como antes, identificar esa 1-forma con un campo vectorial. De ese modo la derivada exterior de una 0-forma coincide con el gradiente de una función.

Para el caso de una 1-forma tenemos que su derivada exterior es:

d\omega = \sum_{i,j}\frac{\partial f_i}{\partial x^j} dx^j \wedge dx^i=\sum_{i<j}\left( \frac{\partial f_i}{\partial x^j} -\frac{\partial f_j}{\partial x^i}\right) dx^i \wedge dx^j

Si interpretamos la 1-forma como un campo vectorial y la 2-forma también como campo vectorial puede verse fácilmente que la derivada exterior coincide con el rotacional. Así mismo podría verse con sencillez que la derivada exterior de una 2-forma identificada a un campo vectorial nos daría la divergencia de ese campo. Nótese que la derivada de una 2-forma es una 3-forma. La 3-formas en \mathbb {R}^3 tienen una úrica componente no nula y, por consiguiente, pueden identificarse con funciones.

Hemos tratado n-formas en \mathbb {R}^n . En una variedad arbitraria (una variedad es, informalmente hablando, la generalización a dimensiones arbitrarias de las curvas y superficies del analisis vectorial- o de la geometria diferencial clásica, si se prefiere verlo así-) tendríamos que en cada punto de la variedad va a estar definido su espacio tangente, que será un espacio vectorial. Este espacio a su vez tendrá su espacio dual. De ese modo podemos trasladar la maquinaria de las formas diferenciales en \mathbb {R}^n a formas en variedades arbitrarias. La única circunstancia que da una complejidad extra es que tenemos mapas de la variedad a \mathbb {R}^n y hay que lleva cuenta de esos mapas.

La derivada exterior permite introducir unos conceptos muy interesantes, muy útiles en topología diferencial.

i) Se dice que una forma es cerrada cuando su derivada exterior es 0. Este concepto es muy útil en física. En el caso en que se identifica una forma diferencial con un campo vectorial eso significaba que el rotacional era 0. Los campos con rotacional son campos conservativos. Eso significa que la integral de ese campo a lo largo de un camino cerrado es nula. O, equivalentemente, que la integral de dicho campo entre dos caminos distintos con el mismo origen y destino es independiente del camino. Como es bien sabido eso permite definir un potencial y el campo en cuestión es una derivada del potencial. Eso nos lleva al segundo concepto importante relacionado con la derivada exterior

ii) Se dice que una n-forma w diferencial es exacta cuando existe una (n-1)-forma diferencial f tal que w=df. Esto generaliza el concepto de potencial de un campo vectorial conservativo.

Puede verificarse usando la definición que toda forma diferencial exacta es cerrada, es decir, que d^2 w= 0 \ \forall w. Lo contrario es falso. Es decir, en general que una forma diferencial sea cerrada no significa que sea exacta. Se puede dotar a las formas diferenciales de grado n con una estructura de grupo siendo la operación de grupo la suma de formas diferenciales (definida de la forma obvia). El grupo cociente de las formas cerradas módulo las exactas se conoce como grupo de cohomología de de Rham definidas en una variedad diferencial M se denota como H^p(M,R). Enseguida comentaré algo sobre que es y que significa.

Antes un pequeña aclaración sobre como entender “módulo las exactas”. La idea es muy simple. En general el potencial escalar no está definido de manera única. Si tenemos que U(x,y,z) es un potencial para un campo vectorial \vec {V}(x,y,z) entonces U(x,y,z) + K (dónde Ka es una constante) también lo es. En electromagentismo tenemos el caso del potencial vector \vec{A}(x,y,z) de un campo magnético \vec{B}(x,y,z) que no está definido de manera única pues si a A le sumamos un campo con rotacional nulo nos dará el mismo campo magnético (recuérdese que el potencial vector cumple que su rotacional es el campo magnético. Obviamente sumar al potencial vector algo con rotacional nulo nos va a dar el mismo campo magnético). Esto se generaliza a formas diferenciales. Si f es tal que w=df se tiene que si a f le sumamos una forma cerrada g se va a seguir teniendo que w=dg. Es decir, que la forma diferencial que nos da w esta definida módulo formas cuya derivada sea nula.

En física las formas diferenciales se usan de manera muy libre con dx indicando “desplazamiento infinitesimal dx”. La teoría expuesta aquí formaliza ese concepto. Aparte de la relación entre el electroganetismo y las formas diferenciales hay muchas mas aplicaciones directas de esta teoría. Po ejemplo, en termodinámica las magnitudes termodinámicas como la energía, la entalpía o la energía libre de Gibbs son, formalmente, formas diferenciales. En relatividad general las variedades y las formas diferencialles son el lenguaje natural para expresar los conceptos. En teoría cuántica de campos y en teoría de cuerdas esta teoria de formas diferenciales, y la topologia algebraica y diferencial en general, jueganmuy diversos papeles esenciales de las mismas.

Puede que a algún físico le haya extrañado la afirmación de que en general una forma diferencial cerrada no es exacta. Después de todo la condición de existencia de un potencial para un campo es que el rotacional sea nulo, osea, que la derivada exterior sea nula, y, por tanto, que la forma sea cerrada. La clave está en que normalmente se piensa en campos definidos en \mathbb {R}^n . Ahí si se cumple que una forma diferencial cerrada es exacta. Eso está conectado con el significado delos grupos de cohomología y, en particular, con el hecho de que los grupos de cohomologia de \mathbb {R}^n sean triviales. En general en una variedad arbitraria M los grupos de cohomología serán distintos de 0. Puede demostrarse que si dos variedades son difeomorfas (es decir, existe un difeomorfismo entre ambas, lo que intuitivamente significa que una puede deformarse en otra de forma suave-entiéndase, diferenciable-) sus grupos de cohomologia de de Rham son isomorfos. El caso contrario es, en general falso. Dos variedades con los mismos grupos de cohomologia de de Rham no son difeomorfas.

El concepto de cohomologia expresado mediante formas diferenciales (la cohomologia de de Rham) es un caso particular de la definición general de cohomología. En general una cohomologia es el dual de una homología. La homologia es una de las primeras técnicas que se introdujo para intentar clasificar espacios que fueran homeomorfos (equivalentes topologicamente). La forma mas sencilla de homologia es la homología simplicial.

Un símplice es, hablando informalmente, algún tipo de conjunto geométrico sencillo cuyo significado tiene sentido en cualquier dimensión. or ejemplo, podríamos definir los 0-símplices como conjuntos de puntos. Los 1-símplices como segmentos. Hasta ahí no hay arbitrariedad. Para definir un 2-simples ya si hay varias opciones. La mas sencilla sería definir un 1-simplice como un triángulo (incluyendo su interior). Pero también podríamos definirlo como un rectángulo. Si optamos por la primera definición un 3-simples seria un prisma. Si optamos por la 2ª un 3 símplice sería un cubo. Por supuesto estas definiciones informales pueden y deben expresarse rigurosamente, pero para el propósito de esta entrada no es necesario.

El concepto de símplice nos lleva al concepto de complejo simpicial, que es, informalmente hablando, un conjunto de símplices unidos entre sí de manera adecuada.

(Imagen de un complejo simplicial)

Una vez dadas estas definiciones comentaré porque son útiles en topología. El concepto clave es que podemos hacer una correspondencia entre un complejo simplicial y un conjunto topológico. Podemos, por ejemplo, deformar (estirando sin romper) las caras de un tetraedro o un cubo para convertirlo en una esfera. Esto es lo que se conoce como una triangulación de la esfera (el nombre proviene del caso en que el símplice son las caras del tetraedro que son triángulos). En realidad un cuadrado puede verse como dos triángulos, así que está claro que no hay gran diferencia entre trabajar con símplices cúbicos o triangulares. En realidad cuando se habla de complejo simplicial se entiende tanto el símplice en sí como el conjunto topológico que se pone en correspondencia con él.

En el párrafo anterior he introducido subrepticiamente un concepto clave, el de frontera. Un símplice tiene una frontera, que a su vez es un conjunto de símplices (excepto los 0-símplices cuya frontera es nula). Un 1 simplex tiene como frontera dos puntos (dos 1-simplices). Un 2-simplice triangular tiene como frontera tres segmentos (dos símplices). Un tetraedro tiene como frontera 4 triángulos, etc.

Un conjunto simplicial es, como dije, un conjunto de símplices de la misma dimensión dispuestos de manera “adecuada”. En particular una de las condiciones de “adecuado” es que los símplices siempre estén unidos entre sí por fronteras. Esto permite definir para un conjunto simplicial arbitrario, que denotaremos por S, su frontera, que denotaremos por \partial S (Aquí el símbolo \partial significa frontera y no tiene nada que ver con su significado habitual en análisis de derivada parcial).

Nótese que, en general, la frontera de un complejo simplicial puede ser nula. Entender porque formalmente requiere dar una definición precisa del concepto de frontera de un complejo simplicial, en la que cada elemento de la frontera se le asigna un signo. Intuitivamente puede verse de una manera muy sencilla. Un complejo simplicial será cerrado cuando los símplices estén unidos entre sí de tal modo que tengan fronteras comunes de tal modo que las de unos símplices cancelan a las de otros. Un ejemplo muy intuitivo ilustra esta idea. Piensese en la esfera y su triangulación mediante un tetraedro. Cada tríangulo del tetraedro tiene vértices comunes con otro triángulo. Ese vértice común se cuenta con signo positivo para uno de los triángulos y con signo negativo para el otro de tal modo que en conjunto su contribución a la frontera es 0. Intuitivamente esto esta relacionado con el hecho de que la esfera es una superficie sin frontera.

Al igual que con las formas diferenciales formas aquí vamos a tener complejos simpiciales cerrados y exactos. Un complejo diferencial (también llamado cadena, a partir de aquí usaré este nombre) es cerrado cuando su frontera es nula. Una cadena es exacta cuando es la frontera de otra cadena.

Podemos definir formalmente la suma de cadenas (en realidad un complejo simplicial es la suma formal de símplices básicos) y se observa que con esa suma el conjunto de cadenas de dimensión n (obviamente las que están formadas por símplices de dimensión n) tiene estructura de grupo. Las cadenas exactas y las cerradas son subgrupos. Al igual que con las formas diferenciales puede verse que una forma exacta siempre es cerrada, pero que el converso es falso en general. Eso nos lleva a definir la homología simplicial como el grupo cociente entre cadenas cerradas módulo las exactas. El grupo de homologia (sobre un cuerpo K) de dimensión n de un complejo simpicial S se denota por H_n(S, k) .

Un aspecto muy importante a tener en cuenta en las aplicaciones es que en general para un espacio topológico podemos tener una cantidad arbitraria de triangulaciones. Lo importante es que los grupos de homología no dependen de la triangulación que elijamos.

Al igual que con la cohomología se tiene que dos espacios homemorfo tienen grupos de homología iguales, pero que, en general, puede haber espacios no homeomorfos con los mismos grupos de homología.

La cohomologia es el dual de la homología. Es decir, se trata de buscar una regla que asigne a cada cadena un número y que sea compatible con la estructura simplicial. En particular puede demostrarse que la cohomologia de de Rham es equivalente a la cohomologia singular en el cuerpo \mathbb {R} . La cohomologia singular es la cohomología “canónica” que se corresponde a la homología singular. La homología singular depende en algunos tecnicismos de la simplicial, pero las ideas intuitivas de una y otra son las mismas.

La clave de la relación entre formas diferenciales y cohomologia es el concepto de integral de una forma en una variedad. Este generaliza al concepto de integral de línea y de superficie de un vector. Además si uno define el concepto e integral para variedades cn frontera se obtiene el teorema de Stokes en variedaes, que generaliza los teoremas clásicos de Stokes, de Green y de Gauss del análisis vectorial. Para dar definiciones adecuadas de estas integrales tendría que dar muchas nociones de teoría de variedades y eso requeriría escribir al menos tanto como lo que ya he escrito y por consiguiente, lo dejaré para otra ocasión. No obstante puede entenderse intuitivamente la idea. A un símplice le corresponde un trozo de una variedad. Uno puede integrar una forma diferencial en ese trozo para obtener un número. Eso respeta las estructuras homológicas necesarias y puede verse que define una cocadena. El grupo de cocadenas os da el grupo de cohomologia, y este es equivalente al grupo de cohomologia de de Rham.

La clave de la homologia y la cohomologia desde el punto de vista matemático es que los grupos homologicos y cohomlógicos son relativamente sencillos de calcular (en particular mas sencillos que los grupos de homotopía). En física es mas normal trabajar con cohomologia y formas diferenciales pues las cantidades físicas mas habituales son muchas veces, en el fondo, formas diferenciales.

La conjetura de Poincaré: I

junio 29, 2009

Posiblemente alguna gente recordará que en el 2003 hubo bastante revuelo en el mundo de las matemáticas. La causa era que por fin parecía haberse demostrado uno de los “problemas del milenio” del instituto Claymath, la conjetura de Poincare que enuncia que cualquier variedad compacta simplemente conexa es equivalente a la 3-esfera (a lo largo del post iré explicando que significan estos términos). El autor de la demostración era un peculiar matemático ruso, Grigory Perelman, basándose en los trabajos de Richard Hamilton (no confundir con Willian Rowan Hamilton, el de la mecánica hamiltoniana) sobre lo que se conoce como flujo de Ricci. en 2006 se le concederia, durante el transcurso del congreso internacional de matemáticas, celebrado en Madrid, la medalla fields de matemáticas. Eso sí, la rechazaría, pero eso es otro asunto.

En el 2007 Donal O’Shea publicó un libro dedicado a esta conjetura y su historia. La traducción al español es del 2008 y en este post comentaré el libro, y la conjetura en si misma.

El libro esta dirigido, aparentemente, a un publico genérico al que no se le presupone especiales conocimientos en física y matemáticas. Ciertamente hay mucho en ese libro que cualquiera puede aprovechar. No obstante algunos aspectos no tengo claro hasta que punto se pueden apreciar realmente bien si no se tiene una buena base en matemáticas, especialmente en topologia y en geometría de variedades. Aparte de los aspectos técnicos el libro es muy detallado en ls aspectos históricos y sociológicos. Yo he leído varios libros de historia de las matemáticas (y biografías de físicos y de matemáticos) y aún así he aprendido detalles muy interesantes en este aspecto en este libro.

El libro empieza contándonos la presentación de Perlman de sus resultados en una reunión de matemáticos a la que ha asistido el autor. Sirve para crear una atmósfera de expectación que justifica la existencia del libro

En los siguientes capítulos, dedicados ala antigüedad principalmente, empieza preguntándose por la forma del mundo. Esto le sirve al autor para presentar varios temas. Por un lado nos va a presentar la idea de como representar la superficie de la tierra en mapas y la idea de un atlas (conjunto de mapas que representan el total de la superficie terrestre). Esto es en el fondo la idea que esta detrás del concepto de variedad bidimensional. Cualquier entorno local de la misma puede ponerse en una correspondencia 1-1 con un trozo de \mathbb R^2 . Dependiendo de si esa correspondencia es continua, diferenciable o lineal a trozos así es la variedad (esta es una observación mía que no esta presente en el libro). También aprovecha para repasar la falsa idea de que en la edad media se creía que la tierra era plana. En realidad la gente culta sabía que la tierra no era plana desde al menos la época de la Grecia clásica. Si uno lo piensa es fácil convencerse de que debía ser así. De un lado tenemos la observación de que lo último que desaparece de la vista cuando un barco se aleja en el horizonte es el mástil, lo cual encaja con que la superficie de la esfera sea curva. Por otro lado tenemos que la sombra de la tierra en la luna durante un eclipse es un círculo. Yo añadiría que el hecho de que la luna se vea como un círculo desde diversos puntos de la tierra sólo es compatible con que la luna sea una esfera. y si la luna es una esfera uno puede imaginar que la tierra también lo és.

En cualquier caso hay documentos históricos que avalan estos hechos. En particular en la época de Colón estaba claro que la tierra era una esfera. Incluso se tenía una medida muy acertada de su radio. Precisamente por eso los portugueses rechazaron la propuesta de Colón ya que el trayecto que el proponía era demasiado largo. De hecho este dato fue bien conocido por los historiadores de siglos posteriores. La percepción del público general de hoy día de que en esa época se creía mayoritariamente en una tierra plana es algo reciente. Se debe a unos versos de Wasington Irving (el autor de “cuentos de la alhambra” entre otors libros) presentados en un acto conmemorativo que daban a entender lo contrario. La gente se quedó con esa cantinela y se ignoró la bien documentada verdad. Ciertamente extenderme tanto en eta anécdota dada la cantidad de cosas que debo presentar en este post parece excesivo. Pero no deja de ser inquietante plantearse cómo la percpecion general del público de hecos historicos trascendentales puede depender de aparentes nimiedades cómo las de un verso afortunado (o desfortunado).

En esos primeros capítulos presenta otros aspectos muy relevantes a lo largo del resto del libro. Por ejemplo, en el cuarto, los postulados de Euclides. Es bien conocido (por los aficionados a la divulgación al menos) que el quinto postulado abriría la puerta a las geometrías no euclideas.

En el tercer capítulo cuestiones sobre como a partir de datos locales, mapas detallados, podemos inferir aspectos globales sobre el mundo. Un atlas suficientemente detallado podria distinguir un mundo esférico de uno de forma toroidal incluso si no tuvieramos medos de ver el planeta desde fuera.

El siguiente capítulo, el cuarto, se pregunta sobre la forma del universo. Ahí presenta descripciones muy detalladas sobre aspectos de la 3-esfera muy curiosos. Muy agradable de leer ese capítulo. Además no olvidemos que la 3-esfera es una pieza clave en la conjetura de Poincaré. Y, por supuesto, generaliza el concepto de superficie al de variedad n-dimensional.

El quinto y sexto capítulo ya se sitúan en tiempos mas recientes. Nos habla sobre como se forjan las geometrías no euclideas en los trabajos de Gauss, Lobachevsky y Bolyai. También nos cuenta muchos detalles de la vida personal y profesional de estos matemáticos y de cómo era la sociedad de esos tiempos en Europa. Cubre aspectos generales de la sociedad y, sobre todo, de las características de las universidades de la época, y de la investigación matemática en general.

El trabajo de Gauss se centra en la geometría diferencial de las superficies bidimensionales. Ya Euler había trabajado en ese tema. La novedad del enfoque de Gauss es que hace hincapié en definir los objetos matemáticos (curvaturas principalmente) en términos de cantidades locales, independientes de como la superficie este embebida en \mathbb R^3 . La relación de esto con el 5º postulado esta relacionado con el hecho de que en una superficie curva las geodésicas (curvas de longitud mínima), que juegan el papel de las rectas en esa superficie no cumplen en general dicho postulado. Por ejemplo en la esfera por un punto exterior a una recta (círculo máximo) pasa un número infinito de rectas.

Los capítulos 7 y 8 están dedicados a Riemann. En el aspecto sociológico es muy interesante leer como Alemania no había sido gran cosa en matemáticas hasta el siglo XIX y cómo la inversión económica cambió eso para sorpresa del resto de países. Hoy día se asocia a Alemania con la matemática y la física y se piensa que siempre han sido buenos en esos asuntos. Pero según cuentan en el libro eso surgió a raíz de disputas territoriales entre las incipientes universidades de la época, en particular Gotinga (famosa mas tarde, en el siglo XX, cómo cuna de muchos de los padres de la mecánica cuántica) y Berlín.

Riemman generalizó los resultados de Gauss para dimensiones superiores. Cuando la variedad tiene mas de dos dimensiones se puede considerar las curvaturas de los diversos planos bidimensionales en esa superficie. Eso da lugar a un tensor, el tensor de Riemann.

El porque en este libro se tratan tanto asuntos geométricos, cuando la conjetura de Poincaré es un tema de características topológicas, es que la prueba de esa conjetura usa el tensor de Ricci, que es una contracción del tensor de Riemann Estos temas suelen ser bien conocidos por los físicos, al menos los teóricos, debido a la conexión entre estas geometrías y la relatividad general. Son también temas que han sido tratados extensamente en diversos libros de divulgación. Es por eso que no me he extendido demasiado en las explicaciones técnicas. A partir de aquí, que es dónde empieza la parte esencial, seré mas detallado.

Los capítulos 9 y 10 están dedicados a Poincaré, y en parte a Kleín. Como siempre la parte histórico/social es excelente. En la parte matemática nos cuenta, entre otras cosas, cómo Poincaré sentó las bases de la topología, creando además algunas herramientas fundamentales para el estudio de esas propiedades. Una vez conocidas esas bases se explica en que consiste la conjetura. Siendo esta la parte fundamental del tema entraré aquí a dar esas nociones matemáticas en una forma técnica. Realmente el libro se queda a un nivel divulgativo. No sé realmente cuanto podrá apreciar un lector sin cualificación matemática a partir de esa exposición. Dado que soy estudiante de matemáticas y que además me dedico a la teoría de cuerdas mis conocimientos en geometría diferencial y en topologia son relativamente buenos y sé lo que esta intentando en estos capítulos. Realmente la parte que para mi resulta novedosa es la que viene en los capítulos siguientes. No obstante no todos los físicos están familiarizados con la topología así que confío en que les puede resultar útil la introducción somera que haré sobre esta disciplina a partir de ahora.

Primero empezaré explicando que entiende un matemático por una topología.

Las nociones de continuidad en cálculo se suelen dar en términos de epsilones y deltas, pero eso en esencia es hablar de entornos abiertos de la recta real, y el caso es que si uno lo analiza uno usa sólo 3 propiedades básicas de los abiertos.

Una topología es recoger esas tres propiedades y convertirlas en axiomas.

Sea X un conjunto y sea Y={Xn} una colección finita o infinita de subconjuntos de X, X e Y forman un espacio topológico si
i. el conjunto vacío e Y pertenecen a Y
ii. Cualquier subcolección finita o infinita {Zn} de Xn tiene la propiedad de que la unión de todos los Zn pertenece a Y
iii. Cualquier subcolección finita {Zm} de los Xn tiene la propiedad de que su intersección pertenece a Y.

Los Xn son los abiertos de esa topología. Conviene hacer una pequeña distinción, que no siempre se explica en los libros de topologia/geometría para físicos. Los intervalos epsilón y deltas del cálculo de una varible, y sus generalizaciones elmentales, los discos abiertos de radio epsilon/delta en el plano, las bolas abiertas en tres dimensiones, etc, son un tipo especial de abiertos, pero, ciertamente, hay conjuntos que son abiertos y no son de esa forma. Esos subconjuntos especiales de la topología forman una base de la misma.

Bien, una vez que tenemos definidos los abiertos cualquier definición que hagamos en términos de esos conjuntos va a ser una definición topológica. Por ejemplo se dice que un conjunto es cerrado cuando su complementario es abierto. Otra noción topologica de interés (en particular necesaria para formular la conjetura) es la de compacidad. Intuitivamente en \mathbb R^n un compacto va a ser un conjunto cerrado y acotado (la distancia entre dos cualesquiera de sus puntos es finita). Pero esa no es realmente la definición de compacidad. Se puede usar esa definición (de hecho en algunos sitios se hace así) pues el teorema de Heine-Borel nos dice que todo conjunto cerrado y acotado en \mathbb R^n es compacto. Pero como dije una noción topológica debe darse en términos de los abiertos. Vamos a ello.

Primero debo explicar la idea de recubrimiento. Dado un subconjunto, S, de un espacio topológico, X un recubrimiento de S es una colección de conjuntos abiertos Rn tal que S esta incluido en la unión de todos los Rn. Se dirá que un conjunto es compacto cuando todo recubrimiento del mismo admite un subrecubrimiento (un cubrimiento con un un subconjunto de la colección recubridora)finito. La noción de compacidad es útil por muy diversos motivos. Una es que, por el teorema de Heine-Borel, podemos caracterizar los cerrados y acotados, un tipo de conjuntos interesante, mediante esta propiedad.Oto aspecto útil es que si queremos demostrar algo sobre un compacto nos basta demostrarlo sobre cualquier elemento del conjunto recubridor y asegurarnos de que la propiedad demostrada no se pierde cuando tenemos una unión finita de esos elementos. Es importante hacer notar que como en un compacto todos los recubrimientos admiten subrecubrimiento finito podemos elegir los Rn de la forma que mas nos convenga.

Tan importante es la noción de compacidad que la mayoria de resultados toopológicos van a estar referidos a espacios compactos. Los no compactos son mucho mas difíciles de estudiar.

Antes de seguir con tecnicismo haré una aclaración importante. Quienes hayan leído en algún libro de divulgación sobre topología lo mas probable es que se la hayan definido algo así como “geometría de las superficies de goma”, o el estudio de las propiedades que se mantienen bajo operaciones de estirar/contraer y de identificar. Eso se parece muy poco a lo que he explicado hasta ahora. El caso es que conviene distinguir dos aspectos de la topologia, Por un lado esta la topologia de conjuntos. Al generalizar las propiedades de los abiertos usados en las definiciones de cálculo nos permite formalizar el mismo y extenderlo a espacios abstractos. Esto es útil para dar un marco común a todas las ramas de las matemáticas. Estas nociones de topologia de conjuntos son fundamentales en las definiciones que se hacen en conceptos relacionados con teoría de la medida, análisis funcional, etc. Y por supuesto también son esenciales en definiciones de geometría (tanto diferencial cómo algebraica). Por otro lado tenemos otro aspecto, que enlaza con la definición dada en los textos divulgativos. Nos va a interesar poder conocer cuando dos espacios son indistinguibles entre si a partir exclusivamente de sus propiedades topológicas.Pues bien, esos espacios equivalentes topologicamente se corresponden a la noción intuitiva de estirar/contraer e identificar. Enseguida veremos la definición técnica de estos conceptos.

Había dicho que la introducción de una topología permitía definir el concepto de función continua de forma abstracta. Vamos con esa definición. Una función f:M->N entre dos espacios topológicos se dice continua si la imagen inversa de un abierto de N es un abierto de M. Sóo con esto se puede dar una definición rigurosa de la idea de que dos espacios son deformables el uno en el otro, es decir topológicamente equivalentes. Dos espacios son topologicamente equivalentes, homeomorfos, cuando existe entre ellos una aplicación continua y con inversa continua, tal aplicación se dice que es un homeomorfismo.(Normalmente se añade la condición de que esa aplicación sea biyectiva). Lo interesante de esto es que si dos espacios son homeomorfos van a tener las mismas propiedades topológicas.

Y tenemos casi todos los conceptos involucrados en el enunciado de la conjetura. Vamos a por los que nos faltan.

Una noción topológica es la de espacio conexo, intuitivamente un espacio es conexo cuando no esta hecho de varias partes separadas.Por ejemplo R 2 sería conexo, un círculo en el plano sería conexo. Sin embargo dos círculos sin puntos en común, por ejemplo círculos de radio uno con centro en (-5.0) y (0,5) no lo serían.

La definición rigurosa de este concepto es:

Un espacio topológico X es conexo si no puede ser escrito cómo X = X1 U X2 dónde X1,X2 son ambos abiertos y X1 Int X2 = Conjunto vacío.

Es fácil probar, no lo haré, que esta definición es “topológica”, es decir que dos espacios, uno conexo y otro no, no pueden ser homeomorfos.Hay más definiciones referentes a la conectividad, conexo por arcos, etc. Pero con esta nos vale.

Nos falta ir un pequeño paso más allá de la mera noción de conexo para poder enunciar la conjetura de Poincaré. Necesitamos explicar que es un conjunto simplemente conexo. Eso requiere entrar en el tema de la homotopía. Para exponer esto voy a seguir el esquema de la wiki, más que nada para aprovechar algunas fotos.

Dos aplicaciones continuas (entre dos espacios topológicos X, e Y) f,g:X ->Y se dicen homotópicas si existe otra aplicación (continua también) H: X x [0,1] -> Y (la x hace referencia al producto cartesiano, [0,1] es el intervalo unidad cerrado) tal que:

H(x,0)=f(x)
H(x,1)=g(x)

Un ejemplo importante es considerar las diferentes clases (homotópicas) de mapas del círculo, S^1, a un espacio X:

S^1 \rightarrow X

la estructura resultante es el importantísimo grupo fundamental. Es este grupo el que nos permitirá definir lo que es un espacio simplemente conexo.

Mas formalmente el mapa de un círculo en un espacio topológico la podemos dar mediante la idea de lazo.

Sea X un espacio topológico, y p un punto fijo de X. Un lazo con base en p es una aplicación continua que verifica γ(0) = γ(1) = p.

El producto α * β de dos lazos α y β se define como . Esto es, el lazo α * β primero recorre el camino de α, pero a “doble velocidad” y después el de β, también a doble velocidad.

Esto nos lleva al concepto de clases de homotopía de lazos, y de ahí al grupo fundamental.

as clases de homotopía son las clases de equivalencia debidas a la relación de ser homotópico. Dos lazos con base en un punto común p son homotópicos si existe una aplicación continua H:[01]x[0,1] ->X tal que

H(s,0)=\alpha (s)
H(s,1)=\beta (s)
H(0,t)=p

El producto de dos clases de homotopía de lazos [f] y [g] se define como [f ∗ g]. Puede demostrarse que este producto está bien definido al ser independiente de la elección de representantes. Este producto nos permite obtener una estructura de grupo (véase la entrada anterior del blog para una introducción a la teoría de grupos): el elemento neutro será la clase [γ] del lazo trivial definido como γ(t) = p para todo t; el inverso de la clase de un lazo [f] será la clase del mismo lazo recorrido en sentido contrario (es decir, f − 1(t) = f(1 − t))

El grupo fundamental de un espacio topológico X basado en un punto p \in X , notado como \pi_1(X,p) , es el conjunto de clases de homotopía de curvas cerradas con la operación yuxtaponer clases. El subíndice 1 en el pi hace referencia a que existen otros grupos de homotopía. La definición del grupo n-ésimo de homotopia sigue la misma pauta, sustituyendo el círculo por la n-esfera. Siendo útiles hay que decir que el grupo mas importante es, con diferencia, el primero, de ahí lo de fundamental. Aquí he definido este grupo. En los cursos introductorios de topologia se suelen dar algunas técnicas elementales para el cálculo del mismo. También en esos cursos se suele mencionar un aspecto importante de este grupo. Dos espacios que tienen el mismo grupo de homotopía se dice que son homotopicamente equivalentes. Se cumple, además, que si dos espacios son homeomorfos son homotópicos, pero no a la inversa. Justo esa falla de que dos espacios homotopicos no sean necesariamente homeomorfos es la que esta detrás de que la conjetura de Poincaré no sea una trivialidad.

Este grupo de homotopía nos va a permitir definir la noción de conexidad simple que aparece en el enunciado de la conjetura. Un espacio se dice simplemente conexo si su grupo fundamental es trivial. Intuitivamente esto significa que cualquier curva cerrada en el espacio es homotópica (contractible) a un punto.

Bien, con esto ya he explicado todas las nociones implicadas en la conjetura que dí al inicio del post. En otra entrada explicaré cómo se demostró la misma, dando definiciones técnicas de algunos de los conceptos que en el libro vienen explicados de manera intuitiva. Mi intención era haber explicado todo de una sola vez, pero para ello tendría que renunciar a unos mínimos de rigor explicativo o hacer un post excesivamente largo, opciones ambas que no me parecen oportunas.

Aunque volveré sobre el libro en la siguiente entrada dedicada al tema no concluiré esta sin aclarar que en los capítulos subsiguientes el autor hace un buen trabajo exponiendo las ideas que llevaron a la demostración. También da apuntes sociológicos (de algunos de los cuales el autor fue testigo de primera mano) relacionados con el desarrollo de la topología en el siglo XX. Con todo ello estamos ante un libro excelente en el terreno matemático y mas excelente aún en el terreno de sociología e historia de la matemática. Eso sí, en este blog comenté, en el post, “El reto de Fermat”, otro libro-titulado igual que el post- dedicado a otro gran problema matemático recientemente, la conjetura de Fermat. Ese libro, también excelente, entraba en bastantes mas tecnicismos que este. Tal vez algunos lectores con una buena formación matemática, pero que no saben nada sobre la conjetura, y que puede que no sean expertos en topologia, echen de menos un libro de esas características. Pero eso no le quita un ápice de mérito al libro de O’Shea. Simplemente deja abierto el camino a que otro autor haga otro tipo de libro sobre la conjetura.

Por cierto, llevo ya varios post con primeras partes sobre temas diversos. Intentaré ir poniendo las correspondientes continuaciones.