2.8 Semiconductores
Introducción
El comportamiento de los distintos materiales ante al conducción eléctrica es muy variado.
En la práctica no existe ninguna magnitud física que tenga un rango de variación tan extenso como el de la conductividad eléctrica, entre los excelentes conductores como el oro y los excelentes aisladores como la porcelana.
Los valores de la conductividad de los llamados semiconductores se corresponden con los valores intermedios de este amplio rango de valores.
Sin embargo, la principal diferencia el comportamiento ante la conducción eléctrica entre los semiconductores y los buenos conductores y aisladores se produce por la dependencia con la temperatura de esos materiales de la conductividad eléctrica.
Este es el asunto de estudio del siguiente apartado.
2.8.1 Discusión inicial
Se discutirán las siguientes afirmaciones:
2.8.2 Estadística de Fermi. Nivel de Fermi
Si se pretende calcular la densidad de electrones en el caso de los semiconductores, debido a existencia de una banda prohibida muy ancha se tendría que separar la correspondiente integral, que toma en cuenta la densidad de estados electrónicos por unidad de energía N(e) y la función de distribución de Fermi f(e), en las dos siguientes integrales:
donde ev es el valor máximo de la energía en la banda de valencia y ec es el mínimo de la energía en la banda de conducción. Esta ecuación permite escribir lo siguiente:
Esta ecuación indica la igualdad entre las densidades de huecos en la banda de valencia y de electrones en la banda de conducción para el caso de los materiales semiconductores puros. Esto es se cumple que nh = ne.
Como se pude probar fácilmente la unidad menos la función de distribución de probabilidades de Fermi es igual a la propia función de Fermi, pero desplazada a un nuevo valor de la energía dado por (e -eF) y que denotaremos por (eh + eFh). Esto significa que la probabilidad de encontrar un hueco en al nivel de energía e con una diferencia del nivel de Fermi |e -eF| por debajo de ese nivel es igual a al probabilidad de encontrar un electrón situado con una energía por encima de ese nivel de Fermi igual a |e -eF|. Entonces tanto los electrones como los huecos obedecen a la estadística de Fermi Dirac, pero para el caso de los huecos todo ocurre como si la energía fuera medida en el sentido contrario. Como es conveniente medir todas las energías de los electrones desde la misma referencia se escoge el valor ec tomemos la variable ee = e ec . Para las energía de los huecos usaremos a variable eh = e ev de tal forma que las energías de los huecos se mide desde el valor máximo de energía de la banda de valencia. Bajo estos presupuestos los niveles de Fermi de los huecos y los electrones son, para estas variables dadas por los valores eh= eFh y ee= eFe.
Entonces se tiene que:
Por otro lado los valores eFe y eFh se corresponden al mismo nivel de Fermi que regula el equilibrio total. Como los niveles establecidos por este procedimiento para medir las correspondientes energías de los huecos y de los electrones estas separados en un valor igual al ancho de la banda prohibida se tiene que:
En la figura se ofrece una representación de estas referencias para medir la energía:
Se puede demostrar que la energía del nivel de Fermi cae en la zona de la banda prohibida, de modo que los valores eFe y eFh son positivos y mucho mayores que kT y bajo estas condiciones las funciones de Fermi para electrones y huecos son prácticamente indistinguibles de las distribuciones clásicas en los intervalos positivos ee y eh, de tal manera que:
Esto permite simplificar en algo el cálculo de las integrales indicadas más arriba, además se puede probar que cerca del fondo de la banda de conducción la densidad de estados electrónicos toma la forma:
donde mef elec es la llamada masa efectiva del electrón. Veamos la interpretación de esta magnitud. En el fondo de la banda de conducción existe un mínimo para la energía. En un diagrama de la dependencia de la energía con el vector número de onda k se tiene una dependencia que permitirá una aproximación parabólica, lo que implica la consideración del gas de electrones como electrones libres. En general al realizar el desarrollo en serie de potencias de la energía alrededor de ese punto de mínima energía se obtienen unos coeficientes del tipo:
donde i,j corren por estos valores para designar las coordenadas cartesianas del vector de onda k. Nótese que estos coeficientes son los coeficientes de un tensor de segundo orden. Para el caso de que la superficie de la energía sea isótropa se tiene que si i y j son distintos el coeficiente correspondiente será nulo y los tres coeficientes para los casos en que i y j sean iguales, tal que se tiene:
En la gráfica siguiente se representan dos ejemplos de esta magnitud:
De esta forma se aprecia que esta magnitud representa las propiedades inerciales de electrón en la banda de conducción, pero no de forma individual, sino que toma en cuenta el efecto de conjunto de todo la acción del cristal sobre esos electrones ya que depende del "perfil" de la dependencia entre la energía en la banda de conducción con el número de ondas.
Al realizar la integral para el cálculo de la densidad volumétrica de electrones en la banda de conducción y de los huecos en la banda de valencia se tienen los resultados siguientes:
y
donde la masa efectiva para los huecos se toma de forma semejante a la de los electrones, pero esta magnitud toma el cuenta el perfil de la curva de la energía de los huecos en al banda de valencia en su dependencia con el número de ondas y donde se ha de tomar en cuenta que la variable eh se mide en el sentido inverso.
Como se cumple que ambas densidades volumétricas son iguales, entonces se tiene que:
Y esto implica que:
Lo que indica que la densidades de ambos portadores de carga dependen de factor de Boltzmann tal que todo ocurre como si se necesitara una energía igual a ½egap.
A la primera de estas ecuaciones se le llama Ley de Acción de Masas.
Todas estos resultados son válidos para los materiales semiconductores puros y mientras se cumpla que egap >> kT, esto es, para los semiconductores intrínsecos a temperaturas moderadas.
Para el caso de la conducción en los metales se tenía que se pude definir la movilidad de los electrones a partir de la expresión:
En el SI esta magnitud se mide en m2/V×s.
De forma que se pueden escribir las ecuaciones:
y
Para el caso de la conducción en semiconductores intrínsecos se debe tomar en cuenta que existe también la contribución de los huecos, de donde definiremos las movilidades de ambos tipos de portadores como:
y
Siendo estas magnitudes tales que la movilidad de los huecos es menor que la de los electrones debido a que para el caso de los huecos su movimiento se origina por el desplazamiento en sentido contrario de un electrón que viene a ocupar ese "hueco". Esto está dado en las expresiones de las definiciones por el hecho de que el tiempo medio entre choque para los huecos es menor, aunque también influye en hecho de que puede ocurrir que masas efectivas no sean iguales.
Entonces para la conductividad del semiconductor intrínseco se tiene:
Como estas magnitudes de la movilidad tienen una débil dependencia con la temperatura (ambas disminuyen al aumentar la temperatura) comparada con la fuerte dependencia con la temperatura de las concentraciones de ambos tipos de portadores de carga, la conductividad en los semiconductores intrínsecos depende de al temperatura en la misma forma que lo hace la concentración volumétrica de ambos tipos de portadores de carga. Esto hace que la conductividad en el cero absoluto sea nula y a medida la temperatura sube la conductividad va aumentando (aunque en esta dependencia se debe tomar en cuenta que el propio valor del gap energético puede variar para temperaturas más elevadas). En esta forma de depender de la temperatura la conductividad está la principal diferencia con el caso de la conducción en metales.
Los semiconductores requieren de altas purezas para que manifiesten sus propiedades como tales. Sin embargo estos materiales son usualmente mezclados con impurezas, después de obtener altas purezas en ellos, de forma controlada. Existen dos tipos de impurezas a utilizar: las llamadas impurezas donoras que son las que pertenecen al grupo V de la tabla periódica (P, As, Sb, etc.) que aportan un electrón por átomo de impureza y las impurezas aceptoras que son las que pertenecen al grupo III de la tabla periódica (B, Ga, In, etc.).
Para el primer caso se tiene que al principio a bajas temperaturas el electrón adicional de cada átomo de impureza se mantiene ligado al núcleo de la misma, pero a medida que aumenta la temperatura y mucho antes que algún electrón de valencia del material semiconductor rompa su enlace, el electrón de la impureza queda libre. Según la teoría de bandas las impurezas de ese tipo hacen aparecen en la zona prohibida de energía determinados niveles muy cercanos a fondo de la banda de conducción y a tales niveles se les llama niveles llamados niveles donores (para el caso de que el semiconductor dopado sea el Ge y el dopaje se realice con impurezas de P la diferencia entre el nivel de la energía del fondo de la banda de conducción y el del primer nivel donor es de 0,01 eV y si el semiconductor es el Si esta diferencia es de 0.005 eV).
Estos niveles donores en la bajas temperaturas están ocupados y al aumentar la temperatura estos electrones pasan a la banda de conducción con gran facilidad y además sin que se forme el correspondiente hueco en la banda de valencia. A este tipo de semiconductor dopado o extrínseco se le llama semiconductor tipo N.
De forma semejante en el caso de que las impurezas sean aceptoras se formarán por encima del límite superior de la banda de valencia y en la zona de energías prohibidas los niveles aceptores, que a bajas temperaturas están vacíos y al aumentar la temperatura pueden ser ocupados con facilidad por electrones de la banda de valencia con la correspondiente formación de huecos en al banda de valencia y sin la correspondiente aparición de electrones en la banda de conducción. A este tipo de semiconductores extrínsecos se les llama materiales tipo P.
De estas forma en los materiales tipo P existe una concentración de huecos mayor que de huecos y en tanto en los del tipo N los portadores mayoritarios son los electrones.
Aún para los materiales semiconductores dopados o extrínsecos se cumple la ley de acción de masas (cabe señalarse que el estudio estadístico en estos casos se complica por el hecho de la ocupación o no los niveles de impureza, pero el cumplimiento de la ley de acción de masas permite una simplificación de esos estudios). Esto significa que aún en estos casos se tiene que:
donde ni es la densidad volumétrica de electrones o de huecos en ese mismo material si no estuviera dopado.
Para los materiales semiconductores puros el nivel de Fermi está a medio camino dentro de la zona prohibida entre los límites superior de la banda de valencia e inferior de la banda de conducción. Pero para el caso de los materiales dopados esto no es así. Por el efecto de el paso de los electrones desde los niveles donores a ala banda de conducción en el caso de los materiales tipo N y el paso de electrones hacia los niveles aceptores desde la banda de valencia, la formación de pares electrón hueco se ve disminuida y en por esto que el nivel de Fermi se desplaza de forma que lo hace, dentro de la banda o zona prohibida, hacia la banda de conducción para los materiales tipo N y hacia la banda de valencia en los materiales tipo P.
Al realizar una análisis de la dependencia con la temperatura de la conductividad en los materiales semiconductores extrínsecos se tiene la influencia de múltiples factores que se combinan de forma tal que resulta una gráfica del logaritmo de la concentración de portadores de carga eléctrica vs. la temperatura, tal y como se muestra:
A bajas temperatura casi toda la conducción se produce por los portadores de carga aportados por la impurezas. Al ir aumentar la temperatura aumentará la cantidad de estos portadores al ir aumentando la ionización de las impurezas. Luego al pasar de una cierta temperatura T1 y hasta que se alcance la temperatura T2 las impurezas ya están totalmente ionizadas, pero aún no se produce un aumento considerable de los procesos que llevas a la formación de pares electrón hueco y por esta razón la densidad volumétrica de portadores de carga se mantiene prácticamente constante y habrá una disminución de la conductividad debido a la disminución de la movilidad de los portadores mayoritarios (electrones o huecos según el caso) y por último al continuar aumentando la temperatura se produce un aumento considerable de la cantidad de pares electrón huecos y la conductividad aumenta considerablemente produciéndose básicamente por los portadores surgidos del comportamiento intrínseco.
Analicemos ahora lo que sucede al poner en contacto dos materiales de dopados de forma que uno sea tipo P y el otro tipo N. Esto conformará la unión P N.
Al principio del contacto y sin aplicar tensión externa alguna y debido al gradiente de concentración los huecos que están como portadores mayoritarios en la zona P y los electrones que están como portadores mayoritarios en la zona N, se producirá por difusión de unos y otros desplazamientos de los huecos hacia la zona N y de los electrones hacia la zona P. Este proceso difusivo provoca que en la zona P en la cercanías de la frontera aparecerá una densidad de cargas negativas y en la zona N y también en las cercanías de la frontera se formará un exceso de cargas positivas esto dará lugar a que en esas zona a ambos lados de la frontera de la unión y que llamaremos región de carga espacial, se instaure un campo electrostático que tenderá a frenar ese proceso difusivo y se llegará a una situación de equilibrio entre la influencia de los gradientes de concentración y la acción del campo electrostático. En esa región de carga espacial se forma una situación semejante a la de un capacitor. Si se trata de describir el campo electrostático que se instaura en la región de carga espacial a través del potencial se tendría que para los electrones se tendrá una barrera de potencial que va aumentando desde cero en la zona N hasta un valor máximo el zona P y cuya variación se produce en toda la extensión de la región de la carga espacial. De forma semejante se tiene un perfil de potencial para los huecos, pero que va desde cero en la zona tipo P hasta una valor máximo en la zona N.
Debido a este campo electrostático que se instaura en la región de carga espacial, se producirá una pequeña corriente de los portadores minoritarios en el sentido dada por el sentido de las líneas de E. Pero estas corrientes son de sentidos contrarios, la de electrones y huecos, y como las densidades de portadores formados bajo el mecanismo intrínseco son iguales, estas corrientes son iguales y des sentidos contrarios.
Cuando a la unión se polariza mediante la aplicación de una tensión externa se puede hacer de dos maneras, una la llamada polarización directa en la cual se conecta al parte del material tipo P la polaridad positiva de la tensión externa y se polariza negativamente la parte del material tipo N. La llamada polarización inversa se logra haciendo lo contrario.
Cuando se polariza la unión de forma directa se altera el equilibrio producido entre los efectos contrarios dados por el gradiente de concentraciones de portadores mayoritarios y por la acción sobre esos portadores del campo electrostático instaurado en la región de carga espacial. Como consecuencia de esto la extensión de la región espacial diminuye y además se debilitan las correspondientes barreras de potencial para los electrones y huecos mayoritarios. La intensidad de la corriente que se produce no solo aumenta con la tensión aplicada, sino que lo hace de forma que la pendiente de la gráfica voltio ampérica aumenta con el aumento de la tensión aplicada. La forma de esta curva viene descrita por la función:
donde V es el potencial externo aplicado.
En las figuras siguientes se muestran de forma esquemática las formas de esta curva voltio - ampérica para una unión P-N, primero para la rama correspondiente a la polarización directa de la unión (lo que significa que la parte P de la unión se coloca al borne positivo de la fuente) y en segundo lugar para la rama correspondiente con la polarización inversa de esa unión. Estas gráficas no están dibujadas a escala, pues los valores de las intensidades de la corriente cuando la polarización es inversa, ante de que es tenga el valor del potencial inverso necesario para la avalancha, son muy pequeños.
Para la polarización inversa se produce un aumento de la altura de las correspondientes barreras de potencial y además se aumenta la extensión de la región de carga espacial. Por esta consideración al corriente debía tener una intensidad nula. Sin embargo debido a la acción del campo externo sobre los portadores formados por el mecanismo intrínseco, es decir, lo electrones y huecos que se forman por pares, aparece una pequeña corriente que la cual es caso independiente del potencial aplicado. Esta corriente tiene una intensidad del orden de la decena de microampere. También para esta parte de la característica voltio ampérica se cumple la ecuación indicada más arriba pero con el signo cambiado.
De esta forma de la característica voltio ampérica de las uniones P N es que se aprovecha la aplicación de esas uniones en la construcción de diodos rectificadores.
Al aumentar el potencial en la polarización inversa se produce un aumento inusitado de la intensidad de la corriente. En el seminario se podrá explicar con detalles ese efecto. Este efecto llamado de avalancha es el que con el correspondiente resistor en serie para limitar el valor de la intensidad de corriente y que no se destruya el cristal y la unión, se utiliza en los llamados diodos Zener.
2.8.3 Conclusiones
Una de las ciencias que más desarrollo ha alcanzado en los últimos años ha sido la Electrónica, en particular la Microelectrónica. Este desarrollo se ha propiciado, entre otros factores gracias a los avances de las Ciencias de los Materiales y a las grandes necesidades crecientes y nacientes en el campo de la computación y de las comunicaciones.
Y el principio de todo este desarrollo estuvo en los estudios acerca de las propiedades ante la conducción eléctrica de los llamados semiconductores.
Desde ahí se originó todo el progreso ulterior en cuanto a los circuitos electrónicos compactados en los llamados microships o circuitos electrónicos integrados.
Ya vida de la sociedad humana sería inconcebible sin estos dispositivos que automatizan un sin número de actividades y que además han permitido lanzar las comunicaciones a estadios inimaginables solo hace unos pocos años.
Aquí radica la importancia de estos estudios elementales de estos materiales, como primer peldaño en estas interesantes propiedades y en sus aplicaciones en la tecnología y en toda la vida social.
2.8 Propiedades magnéticas de las sustancias
Introducción
De forma semejante a como se vio las interacciones de las sustancias con el campo electrostático, es ahora de interés estudiar las interacciones de las sustancias con el campo magnético.
En presencia de medios que son capaces de magnetizarse la Ley de Ampere, se mantiene en su cumplimiento al igual que las definiciones que se han revisado hasta el momento, pero producto de la magnetización de las sustancias no se conocen de antemano todas las características de las distribuciones de corriente, pues las corrientes a nivel de las unidades estructurales que componen la sustancia y que son responsable de la magnetización de la sustancia, hasta que no se conozca el campo vectorial Inducción Magnética. Por esta razón es que se reformula la Ley de Ampere para que quede expresada en términos de la circulación de un nuevo campo vectorial, que llamaremos Intensidad del Campo Magnético y cuya circulación solo depende de las corrientes eléctricas que son extrañas o externas a las sustancia.
Por otro lado el propio comportamiento de las distintas sustancias es de sumo interés pues las respuestas a las interacciones con el campo magnético son muy variadas y estos distintos tipos de comportamiento se pueden emplear de diversas formas en las aplicaciones técnicas de estas propiedades.
2.9.1 Discusión inicial
Se discutirán las siguientes afirmaciones:
2.9.2 Clasificación de las sustancias desde el punto de vista magnético. Fenómeno de magnetización
Las distintas sustancias están compuestas de determinadas unidades estructurales, que en muchos de los casos son las propias moléculas, y estas unidades tienen un determinado momento magnético m asociado. Estos momentos magnéticos se pueden explicar aduciendo que los movimientos de los electrones en los orbitales de la molécula se pueden considerar como corrientes eléctricas en lazos cerrados y además, y esto es un fenómeno netamente cuántico, los electrones, y otras partículas que conforman la estructura interna de las unidades estructurales de las sustancias, tienen momento de espín y producto de esto un momento magnético intrínseco.
Si dentro de un cuerpo de determinada sustancia se toma un elemento infinitesimal de volumen DV y se calcula la resultante de todos los momentos magnéticos de las unidades estructurales, que adelante llamaremos moléculas, contenidas en ese elemento de volumen, en el límite cuando ese elemento de volumen tienda a cero se tendrá la magnitud, que es un campo vectorial que toma valores en todos los puntos del cuerpo conformado por esa sustancia, y que se denomina Magnetización de la sustancia y que representamos por M(r), así:
Pero debe tomarse en cuenta que este limite tiene características físicas pues el elemento de volumen debe ser tan pequeño como para poder asignar un vector M a cada punto del cuerpo y sea entonces M una función de punto y por otra parte ese elemento de volumen debe ser los suficientemente grande como para que contenga una gran cantidad de moléculas y no se pierda en enfoque macroscópico que presenta el electromagnetismo clásico.
En el SI en módulo de este vector magnetización se mide en A/m2.
El comportamiento de las distintas sustancias ante la acción del campo magnético se puede caracterizar fenomenológicamente como sigue:
![]() | Para un grupo de sustancia al acercarles algún ente que tenga asociado un campo magnético, tal como un imán permanente o una bobina con corriente estacionaria, sobre el cuerpo constituido por una sustancia de ese tipo, recibe la acción de una fuerza repulsiva de muy pequeña intensidad. A tales sustancias se les llaman diamagnéticas. Si se midiera el módulo del valor del vector Inducción Magnética en el interior de este cuerpo se apreciaría que este valor será casi igual, pero menor que en esos mismos puntos, con respecto a la entidad asociada con el campo magnético instaurado, si se retirara el cuerpo de la sustancia en estudio. Además todos estos efectos desaparecen al retirarse el agente asociado con el campo magnético. |
![]() | Para otro grupo de sustancias se tiene que al acercarles esas entidades con un campo magnético asociado, sobre el cuerpo en cuestión aparecen fuerzas atractivas, también en este caso de muy pequeña intensidad. Estas sustancias se llaman sustancias paramagnéticas. En estos casos el módulo del vector Inducción Magnética en los puntos en el interior del cuerpo constituido por una sustancia de este tipo será casi igual, pero mayor, que los valores de ese módulo en esos mismos puntos si se retirara el cuerpo de la sustancia en estudio. También en este caso todos los efectos desaparecen si se retiran las entidades asociados con el campo magnético. |
![]() | En los casos de cuerpos constituidos de sustancias tales que al acercar esos cuerpos a las entidades relacionadas con determinados campos magnéticos, actúan sobre estos cuerpos fuerzas atractivas de gran intensidad. En este caso se distinguen los casos de las sustancias llamadas sustancias ferromagnéticas. También existen las sustancias llamadas sustancias ferrimagnéticas. Estas sustancias se distinguen de las ferromagnéticas por la influencia que ejerce, en su caso, el tipo de estructura cristalina sobre el comportamiento magnético. Las principales sustancias que presentas esta característica son las llamadas ferritas. Ahora el módulo del vector Inducción Magnética en puntos en el interior de los cuerpos compuestos por esas sustancias será mucho mayor que el módulo de ese vector en esos mismos puntos si se retirara el cuerpo en estudio. Por otra parte, si se retiran las entidades asociadas con el campo magnético, permanecería determinado efecto sobre estos cuerpos que consiste en una cierta magnetización del cuerpo. |
Definamos un nuevo campo vectorial para caracterizar el campo magnético y que llamaremos Intensidad del Campo Magnético y lo haremos mediante la llamada Segunda relación de Constitución, tal que:
Como se aprecia también el módulo de este vector se mide en el SI en A/m2.
Cuando un cuerpo constituido de determinada sustancia se somete a la acción de un campo magnético externo el campo vectorial Magnetización, en cada punto del cuerpo dependerá del valor del vector Intensidad del Campo Magnético en ese punto mediante la relación:
donde cm es la susceptibilidad magnética que es una magnitud adimensional y que en general es función del H y que depende del tipo de material. En general se trata de una magnitud para la que deben darse 9 números ordenados para tener toda la información necesaria.
Llamaremos materiales homogéneos, isótropos y lineales a aquellos en que la susceptibilidad es viene expresado por un solo número y además no dependería de H.
Para este tipo de materiales, que más adelante veremos que se trata solo de los diamagnéticos y los paramagnéticos, se tiene entonces que:
donde mr y m son las constantes magnéticas relativas (adimensional) y absoluta (con dimensiones y que en el SI se mide en H/m) respectivamente.
Veamos la relación entre el vector Magnetización y la cantidad de corrientes moleculares o de Ampere.
Si se tiene, como en la figura,
un elemento de contorno de integración dl y sean los lazos de las corrientes de Ampere de intensidad i'm y sea el área del lazo de esas corrientes designadas por Am, entonces sea N la cantidad de unidades estructurales por unidad de volumen en el seno del material dado. Así se tiene que la corriente neta ensartada en ese elemento infinitesimal de contorno de integración sería:
donde el campo vectorial M es la magnetización del medio.
De lo que se ha demostrado, si se tiene que al aplicar la ley de Ampere Maxwell nos quedaría:
donde ineta-ensartada es la intensidad de la corriente que implica el movimiento real de portadores de carga, pero que no toma en cuenta las contribuciones de las corrientes ampereanas.
Esto implica que:
de modo que ordenado se tiene:
En esta ecuación ineta-ensartada es la intensidad de la corriente neta ensartada debido al movimiento de portadores de cargas en distancias que superan los lazos moleculares y i'neta-ensartada es la intensidad de las corrientes moleculares netas ensartadas. Además el vector J es la densidad de corriente neta ensartada en el contorno C debida al movimiento de portadores de cargas en distancias que superan los lazo moleculares.
Aplicando el teorema de Stokes y el del valor medio del cálculo integral y gracias a la arbitrariedad del contorno de integración se obtiene la forma diferencial de la expresión matemática de esta ley para el caso general que estén presentes medios sustanciales, de tal suerte que:
donde el vector J es la densidad de corriente que circula por el material sin tomar en cuenta las corrientes de Ampere.
Esta es la expresión diferencial de la Ley de Ampere-Maxwell en términos del campo vectorial Intensidad del Campo Magnético.
Desde el punto de vista de los valores y tipo de comportamiento de la constante magnética de los distintos tipos de sustancias ante el magnetismo se tiene que para las sustancias diamagnéticas esa magnitud es casi igual en valor a la constante magnética del vacío, pero algo menor, (esto indica que la susceptibilidad magnética es próxima a cero, pero algo menor). Realicemos un estudio, clásico, del diamagnetismo.
El electrón en una determinada órbita en el átomo, tal como se muestra en la figura:
Este movimiento se puede considerar como una corriente eléctrica de intensidad:
donde t y w son el periodo y la frecuencia angular de las rotaciones que realiza el electrón en su órbita. Supongamos, para facilitar el análisis que la órbita electrónica es de radio R y que al accionar el campo magnético pueden producirse cambios en la frecuencia angular del electrón, pero el radio de la órbita permanecerá constante. Entonces se tiene que el electrón en su órbita tiene asociado un momento magnético dado por:
donde k es un vector unitario perpendicular al plano de la órbita del electrón.
También por simplicidad consideremos que se va a instaurar un campo magnético cuyo vector Inducción Magnética tiene un módulo que crece en valor desde cero hasta el valor B0. Además su dirección es perpendicular al plano de la órbita electrónica que estamos analizando. Producto de la variación local temporal de campo vectorial Inducción Magnética, en los puntos sobre la órbita aparece un campo eléctrico no conservativo según establece la Ley de Inducción Electromagnética de Faraday.
Así:
Y como la trayectoria del electrón la suponemos circular e integrando:
que implica que:
Provocada por este campo eléctrico inducido, aparece una fuerza eléctrica sobre electrón que será tangente a la trayectoria y que provocará a su vez una aceleración cuyo escalar viene dado por:
donde m0e es la masa en reposo del electrón y a la última igualdad se establece gracias a la relación entre la aceleración lineal y la aceleración angular para una partícula animada de movimiento circular acelerado.
Así se llega a:
que en términos de los diferenciales queda:
Ahora integrado desde el valor o hasta B0 se tiene:
donde wL es la llamada Frecuencia de Larmor.
Al producirse este aumento en la frecuencia angular del electrón en su órbita se tiene que se produce una variación en el escalar asociado con el vector momento magnético de la órbita del electrón, tal que:
Estos resultados a pesar de que fueron obtenidos para las condiciones que se impusieron, son de carácter general y válido aún cuando no se cumplan esas restricciones.
De esto se tiene que al irse instaurando un campo magnético cuyo vector Inducción Magnética tenga un módulo que aumente desde cero hasta un determinado valor aparecerá un momento magnético inducido en cada órbita electrónica que será opuesto en dirección al vector Inducción Magnética. Debido a esta oposición en sentido es que aparece el hecho de que aparezca una fuerza repulsiva sobre los cuerpos constituidos por sustancias diamagnéticas cuando se acercan a entidades con campos magnéticos asociados o cuando en la región donde se encuentran esos cuerpos se instaura un campo magnético de tal forma que su Inducción Magnética vaya creciendo en módulo.
En última instancia esta repulsión se debe a la negatividad de la carga del electrón. Si un campo magnético interactuara con un átomo de antimateria, es decir, con un átomo compuesto por un núcleo de antiprotones y antineutrones y con la envoltura compuesta por positrones (antielectrones), el antidiamagnétismo fuera tal que aparecería una fuerza atractiva sobre los cuerpos compuestos de tales sustancias.
Por otra parte el hecho de la poca intensidad de las fuerzas de repulsión que surgen en el comportamiento diamagnético se explica por la pequeñez del coeficiente que relaciona al memento magnético inducido y a la Inducción Magnética.
Como todos las sustancias tienen electrones en sus correspondientes átomos, todas las sustancias tienen un cierto comportamiento diamagnético. Pero si ocurren otros efectos que puedan hacer que el diamagnetismo no se pueda manifestar como comportamiento principal la sustancia deja de clasificarse dentro de las que tienen un comportamiento diamagnético. Tales son los casos de las sustancias paramagnéticas, ferromagnéticas y las ferrimagnéticas.
Para el caso de las sustancias paramagnéticas se tiene que las unidades estructurales que los componen, átomos o moléculas, son de tal tipo que tienen un momento magnético permanente. Estos dipolos magnéticos interactúan muy débilmente entre sí o no interactúan. Al colocar un cuerpo compuesto por una de estas sustancias en una región donde esté instaurado un campo magnético se producen dos efectos contrarios:
![]() | Sobre los dipolos magnéticos permanentes actúan momentos de fuerzas magnéticas que tienden a orientar en la misma dirección y sentido que el vector Inducción Magnético del campo magnético actuante a esos momentos magnéticos por giro de las unidades estructurales correspondientes. En cuanto se han logrado orientar muchos de los dipolos magnéticos, el propio campo magnético externo interactúa con el campo magnético asociado con estos dipolos magnéticos orientados y se produce, así, un mecanismo para el surgimiento de fuerzas atractivas sobre el cuerpo constituido de tales sustancias. |
![]() | Los electrones en las órbitas cambian sus frecuencias angulares produciéndose el
mecanismo diamagnético. Como el efecto diamagnético es muy débil, este efecto es "enmascarado" o vencido por el primero de los efectos descritos. |
Por otra parte al tomar en cuenta el estudio del primero de los dos efectos deben considerarse dos aspectos de primer orden:
![]() | La existencia de dos mecanismos de contribución a la formación de los dipolos magnéticos permanentes de las unidades estructurales, a saber: la contribución de las órbitas electrónicas y la contribución de los momentos magnéticos asociados con los momentos de espín de los electrones (este es un mecanismo cuántico que no puede ser explicado clásicamente). Además debe considerarse la interacción entre los propios dipolos magnéticos. |
![]() | La influencia que ejerce el movimiento de agitación térmica de las unidades estructurales que se opone a la orientación de los dipolos magnéticos de esas unidades estructurales y por otro lado que la temperatura a que se encuentra el cuerpo en estudio en su interacción con el campo magnético sobre la cantidad de momentos magnéticos asociados con los momentos de espín que pueden estar orientados de forma que una de sus componentes sea paralela o antiparalela con las líneas de B. |
Todo esto implica una determinada dependencia con la temperatura de las características paramagnéticas de las sustancias.
Se puede demostrar que para las altas temperaturas se tiene el cumplimiento de la llamada Ley de Curie Weiss que establece que la susceptibilidad magnética de la sustancia depende de la temperatura mediante la expresión:
donde C es una constante y TC es la llamada temperatura de Curie y que vienen dadas por:
y además se cumple:
donde N es la densidad volumétrica de espines; mB es el llamado magnetón de Bohr (un magnetón de Bohr cumple que mB=eh/4pm0e) que es la magnitud en términos de la cual se miden los momentos magnéticos en el micromundo; m0 es la constante magnética del vacío: kB es la constante de Boltzmann y l es una constante que depende del tipo de sustancia.
Para el caso del hierro TC es del orden de 1 100 K (unos 600 ºC).
Del cumplimiento de esta ley se aprecia que a medida que asciende la temperatura del cuerpo, su susceptibilidad magnética se hace más y más próxima al valor cero. Esto hace que el material no pueda presentar un comportamiento ferromagnético a esas temperaturas y su comportamiento será diamagnético.
De sumo interés es la situación a bajas temperaturas. Al ir descendiendo la temperatura y aproximarse a TC la susceptibilidad va aumentando y aún cuando el campo externo aplicado se anule posteriormente podrá quedar una magnetización remanente.
Ya en el rango de las bajas temperaturas, por debajo de la temperatura de Curie, esta ley deja de cumplirse, pero en su lugar se demuestra que el material es capaz de quedar con una magnetización permanente aún en ausencia del campo magnético externo y ofrecer un comportamiento ferromagnético.
De esta forma ahora se puede comprender mejor cuando un material tiene un comportamiento diamagnético. Si no presenta dipolos magnéticos permanentes, entonces solo estará presente el efecto diamagnético. Esta situación se produce para materiales cuyos átomos tienen estructuras electrónicas de capas llenas.
Tanto para el comportamiento diamagnético como para el paramagnético se tiene que existe un comportamiento lineal, es decir, al ir aumentando el campo externo crece en la misma medida la magnetización del material y al retirarse el campo externo el material recupera sus propiedades anteriores y pierda su magnetización. Por otro lado no existe dependencia, en general, de la susceptibilidad magnética del material con la dirección y sentido de, vector Intensidad del Campo Magnético. En tales casos se dice que estamos en presencia de materiales homogéneos, isótropos y lineales.
Una relación de varios materiales diamagnéticos y paramagnéticos se ofrece en la tabla siguiente:
Material | c m× 105 | (m / m 0) |
Aluminio | 2,3 | 1,000023 |
Bismuto | 1,66 | 0,9999834 |
Cobre | 0,98 | 0,9999902 |
Diamante | 2,2 | 0,999978 |
Cloruro de gadolinio | 276,0 | 1,002760 |
Oro | 3,6 | 0,999964 |
Magnesio | 1,2 | 1,000012 |
Mercurio | 3,2 | 0,999968 |
Plata | 2,6 | 0,999974 |
Sodio | 0,24 | 0,9999976 |
Volframio | 7,06 | 1,0000706 |
Dióxido de carbono CO2 a 1 atm |
0,99× 10-3 | 0,999999901 |
Hidrógeno H2 a 1 atm | 0,21× 10-3 | 0,999999979 |
Nitrógeno N2 a 1 atm | 0,50× 10-3 | 0,999999950 |
Oxigeno O2 a 1 atm | 209,0× 10-3 | 1,000002090 |
2.9.4 Ferromagnetismo.
Teoría de los dominios e histéresis magnética. Efecto Hall
Analicemos los casos de las sustancias ferromagnéticas (Fe, Ni, Co).
El comportamiento de estos materiales se explica con auxilio de la teoría de los dominios magnéticos. Un dominio magnético es una región dentro del sólido en el todos los momentos magnéticos de las correspondientes unidades estructurales están orientados de forma que todos ellos son paralelos. Desde el punto de vista energético esta organización de los dipolos magnéticos requiere de un análisis de pues ha de haber mecanismos que se contrapongan para lograrse los estados de mínima energía con la consiguiente estabilidad en los sistemas. En el caso del ferromagnetismo se debe considerar el hecho de que las propiedades magnéticas de los elementos de transición, tales como el hierro, en última instancia se deben en los momentos magnéticos asociados con las órbitas electrónicas y al espín de esos electrones de las capas electrónicas internas que no están llenas.
Una primera contribución a la energía es la energía de magnetostática y que es aquella vinculadas con el hecho dado por que sí dos un dominio de una determinada extensión se dividiera en dos partes de suerte que en una de ella el vector magnetización tenga un sentido y en la otro el sentido opuesto, se tendría una energía menor que cuando toda esa extensión se tendría un solo sentido para el vector magnetización. Esto significa que en general la tendencia debía ser a que los dominios fueran de la menor extensión posible y de esta forma que esta energía magnetostática. Pero debe tomarse en cuenta que la propia aparición de las fronteras entre los dominios contribuye al aumento de la energía del sistema debido a la energía adicional que aparece para conformar los cambios necesarios para pasar de un estado de orientación de vector magnetización.
Por otra parte se tiene el carácter de las anisotropías del sólido cristalino. Por ejemplo en el caso del hierro que tiene una estructura cristalina cúbica se sabe que es más fácil que se produzca la magnetización en las direcciones de las aristas de los cubos, luego, en menor grado de facilidad en las direcciones de las diagonales de la caras de los cubos y por último la de mayor grado de dificultad es la dirección de la diagonal de los cubos. De ahí que los cambios de la magnetización estén más favorecidos en determinadas direcciones que en otras y esto explica, entre otras cosas, que en las fronteras de los dominios, y dentro de la misma cristalita, los cambios más favorecidos energéticamente los cambios en 90º de ese vector. Una distribución de los dominios, que se logra "visualizar" por la técnica de colocar óxido de hierro coloidal sobre una superficie preparada de una muestra magnetizada de un material ferromagnética, se representa esquemáticamente en la figura:
donde los dominios pequeños y en forma triangular en este corte se llaman dominios de cierre y completan la situación para que la magnetización total sea nula en el caso inicial de una muestra ferromagnética virgen.
Otro elemento a tener en cuenta en la contribución de la llamada energía de intercambio y que tiene un origen cuántico. La explicación de ese mecanismo puede ser, de forma simplificada, como sigue: como por ejemplo en el caso del hierro se tiene que existen seis electrones en una capa interior no llenada. Estos electrones tienen espines de orientaciones tales que los correspondientes momentos magnéticos asociados estarán unos orientados en un sentido, digamos "hacia abajo", y otros en el sentido contrario, "hacia arriba". Ellos, en concordancia con el Principio de Exclusión de Pauli, se disponen en parejas en el mismo nivel de energía llenando los niveles más bajos en la correspondiente banda. Al interactuar con un campo magnético externo algunos de los electrones que tienen un momento magnético orientados de forma que son contrarios a ese campo externo pueden pasar a niveles superiores cambiando la orientación de su momento magnético intrínseco y esto se puede producir hasta que no queden niveles disponibles en la banda. A pesar de lo que significa en aumento de energía al ascender en la banda de energía, este estado sería menos energético que si se mantuvieran en los niveles más bajos, pero con la orientación inadecuada con respecto al campo magnético. La diferencia entre las energías de estas dos configuraciones se le llama energía de intercambio. Este mecanismo tiene a disminuir la energía en la medida que se hace más extensa la región de cada dominio al tener más átomos esa distribución de los momentos magnéticos intrínsecos.
Esta situación se representa en la figura que sigue:
Otra contribución a la energía es la producida que debe tomarse es la debido a la magnetoestricción que consiste en surgimiento baja la acción del campo magnético externo de tensiones internas capaces de deformar la muestra. En particular en caso del hierro estas tensiones son tales que las muestra se alargan en la dirección del vector magnetización.
Cuando se toma un cuerpo de un material ferromagnético virgen en el sentido que no tenga historia anterior en las interacciones con el campo magnético o se haya producido un proceso con el cual esa historia anterior se haya "borrado" (tales procesos serían el aumento de la temperatura o recibir energía mediante acciones mecánica, como por ejemplo golpes), se coloca bajo la acción un campo magnético caracterizado por el vector Intensidad del Campo Magnético H y el módulo de este vector se va aumentando paulatinamente se tiene que al medir el vector Magnetización en el interior del cuerpo se obtiene la siguiente gráfica:
Al analizar las distintas partes de esta curva esemoidal se tiene que desde el punto o al punto a todos los procesos son reversibles y el aumento de la magnetización se logra a expensas de los desplazamientos reversibles de las fronteras de los dominios a favor del aumento de la extensión de los dominios mejor orientados con respecto al campo aplicado. Luego desde el punto a hasta el punto b el aumento de la magnetización se produce a partir de los desplazamientos irreversibles de las fronteras de los dominios a favor de esos dominios mejor orientados. Como estos son procesos irreversibles, al irse disminuyendo el valor del módulo de la Intensidad del Campo Magnético, la magnetización del material no desciende por la misma curva en la gráfica, lo que provoca que exista como una "memoria del material" recordando su interacción anterior con el campo magnético. Y desde b en adelante el aumento de la magnetización ya el mecanismo de la traslación de las fronteras se ha agotado pues entrañaría muy grandes cantidades de energía y entonces se produce la rotación de algunos dominios bajo la acción del campo magnético. Estos procesos son también irreversibles y además tienden a la saturación en el sentido que no todos los dominios podrán ser rotados. Pero debe indicarse que este proceso de aumento de la magnetización tiene dos etapas ya que primero se produce la rotación que involucra las direcciones cristalográficas más favorecidas para la magnetización y luego al ir alcanzando la saturación, se producen las rotaciones que involucran a las direcciones cristalográficas menos favorecidas.
Si después de alcanzan la saturación se comienza a disminuir el módulo del vector H hasta el valor cero, la magnetización no se reduce siguiendo esta curva e incluso al llegar a cero el módulo de H quedará una cierta magnetización permanente o remanente MR. Si ahora se aumenta el módulo de H, pero de tal manera que el vector apunte en el sentido contrario a como lo hacía al inicio, se tendrá una disminución de la magnetización por debajo de la magnetización permanente MR y será necesario llevar el módulo de H hasta el valor Hc, llamado fuerza coercitiva, para poder reducir a cero el módulo del vector magnetización. Al continuar cíclicamente cambiando el sentido del vector H se completa el llamado ciclo de histéresis magnética. Este ciclo permite explicar el procedimiento para la fabricación de los imanes permanentes.
Efecto Hall
Si se considera la interacción del los electrones libres de un metal bajo la acción de un campo magnético externo aplicado se puede plantear la ecuación:
que es válida en general para el movimiento de un electrón libre. En esta ecuación el primer sumando del miembro de la izquierda está relacionado con la aceleración del electrón libre bajo la acción del campo electromagnético aplicado y el segundo sumando da cuenta de la "fricción" debido a las colisiones con los defectos de la red cristalina, siendo t el tiempo medio entre colisiones.
Consideremos que el campo magnético es uniforme con valor B.
Si se puede tomar:
la ecuación del movimiento quedaría como:
donde se ha sustituido la velocidad por dv, que se puede tomar como el valor medio de la velocidad del electrón sobre la esfera de Fermi.
Sí ahora consideramos que B es paralelo al eje de la z. Para cuando se puede considerar que el tiempo medio entre colisiones es muy grande y para el caso en que E sea nulo, se tiene:
y
cuyas soluciones son:
y
donde es la denominada frecuencia angular ciclotrónica para el electrón libre y cumple que:
Ahora se puede analizar que la condición para que aparezca una resonancia bien definida es que el producto de la frecuencia ciclotrónica por el tiempo promedio entre colisiones sea mayor que la unidad.
En las soluciones anteriores la amplitud de las oscilaciones temporales que tienen las componentes de la velocidad en la superficie de Fermi, no es la rapidez de Fermi, sino una magnitud que es un valor inicial cualquiera de la rapidez de arrastre en el mar de Fermi.
En la medida que al temperatura del material sube el tiempo promedio entre las colisiones disminuye y con ello la condición de resonancia se va perdiendo de forma que los electrones libres no podrán completar muchas vueltas, por ejemplo a la temperatura ambiente. Pero para temperaturas bajas cercanas a las de ebullición del helio líquido se pueden completar una gran cantidad de órbitas ciclotrónicas.
Veamos ahora el caso en que B sigue siendo paralelo al eje de las z, pero ahora E no es nulo.
En este caso las ecuaciones del movimiento del electrón por componentes serán:
Y bajo las condiciones estacionarias en un campo eléctrico estático se tiene que las sumandos que involucran las derivadas temporales no aparecen y nos queda:
de modo que resolviendo las dos primeras ecuaciones para las componentes en x y en y de dv se llega a:
que se completa con la ecuación:
Recordando la relación entre la densidad de corriente eléctrica y la velocidad de los electrones:
y definiendo la magnitud:
se llega a las ecuaciones por componentes de la densidad de corriente eléctrica:
De esta forma obtenemos las nueve componentes del tensor de segundo orden que representa la conductividad en presencia de un campo magnético estacionario y dirigido en la dirección. Las componentes que no se escriben directamente en estas ecuaciones son nulas.
En una representación tensorial se tiene:
con el tensor de la conductividad dado por:
Como se aprecia de estas ecuaciones el fenómeno del transporte de portadores de carga en la dirección de la inducción magnética, no se afecta y todo ocurre como si el campo magnético no estuviera aplicado.
Para las componentes diagonales del tensor de la conductividad son tales que ellas decrecen monótonamente al incrementarse la inducción magnética del campo magnético aplicado o con el aumento de la frecuencia ciclotrónica. Entre tanto las componentes no diagonales de este tensor que no son nulas, primero aumentan al aumentar el módulo de la inducción magnética del campo magnético aplicado, pero si este sigue aumentando, estas componentes decrecen.
Como se aprecia las conductividad de un cuerpo que esté colocado en unas zona donde esté instaurado un campo magnética dependerá de la geometría del cuerpo.
Si se dispone una barra recta de sección rectangular de material conductor y de forma tal que su dimensión más larga esté a lo largo del eje de las x y que está aplicado un campo magnético externo uniforme y constante y cuya inducción magnética es paralela al eje de las z y un campo electrostático uniforme cuya intensidad es paralelo al eje de las x.
Si no se permite que los portadores de carga pasen a través de las caras de la muestra que son paralelas al plano coordenado xz, esto hace que la componente de la densidad de corriente a lo largo del eje de las y sea nula.
De las ecuaciones anteriores se entiende que solo esto es posible si aparece un campo electrostático cuya intensidad sea paralela al eje de las y. Y así:
La aparición de esta campo lateral se conoce como el efecto Hall.
Definamos la magnitud:
a la que se denomina Constantes de Hall y que es negativa para los electrones libres.
Como esta constante es fácil de medir experimentalmente directamente de su definición, ella permite una sencilla forma de medir la concentración de portadores de carga n.
A estos resultados sencillos se ha llegado asumiendo que el tiempo promedio entre una colisión y otra es independiente de la rapidez de los electrones. En caso que se tome en cuenta la dependencia de este tiempo con la rapidez de los electrones, entonces la constante anterior estará afectada por un factor del orden de la unidad.
En los casos de los semiconductores la expresión anterior se hace más complicada debido a que tanto los electrones como los huecos contribuyen en a la densidad de corriente eléctrica.
Introducción
Desde los inicios de la humanidad los fenómenos luminosos se convirtieron en una de las principales indagatorias del pensamiento humano.
Muchas fueron las teorías que trataron de explicar estos fenómenos, desde las ideas místicas hasta ideas con un basamento más cercano a la ciencia.
Pero no fue hasta el desarrollo por Maxwell sobre la Teoría Electromagnética de la Luz que estas teorías no se sustentaron sobre bases verdaderamente científicas.
Es por tanto de gran interés adentrarse en los elementos de esta teoría para permitir el ulterior estudio de la Óptica Ondulatoria y de las principales aplicaciones de las ondas electromagnéticas en las Telecomunicaciones.
2.10.1 Discusión inicial
Se discutirán las siguientes afirmaciones:
Resumiendo los aspectos que hemos estudiado al incorporar a los sistemas electromagnéticos la presencia de medios distintos del vacío, podemos realizar la tabla siguiente incluyendo las formas integrales y diferenciales de las ecuaciones de Maxwell para el caso de la presencia de medios:
Ecuación |
Forma integral |
Forma diferencial |
|
Ley de Gauss |
|||
Ley de Ausencia de Cargas Magnéticas Aisladas |
|||
Ley de Ampere Maxwell |
|||
Caso general | |||
Ley de Inducción Electromagnética de Faraday |
Fem inducida en movimiento |
||
Fem por variación local temporal de B |
Debemos recordar que este sistema debe ser satisfecho en conjunto al explicar un determinado fenómeno electromagnético.
Además deben tomarse en cuenta las dos relaciones de constitución, a saber:
Y por otro lado la relación siguiente:
Que se constituye en la llamada ley de Ohm para el caso que la conductividad no dependa de la intensidad del campo eléctrico.
Otra de las ecuaciones auxiliares al sistema de ecuaciones de Maxwell es la llamada ecuación de continuidad, que expresada en forma diferencial tiene el aspecto:
donde r es la densidad volumétrica de carga eléctrica.
Escribamos las ecuaciones de Maxwell en su forma diferencial para el caso del vacío:
Tomemos la tercera ecuación y evaluemos el rotacional de la misma, quedando:
donde se tiene que:
que es la rapidez de propagación de estas ondas en el vacío y coincide con la rapidez de propagación de la luz en el vacío.
En este desarrollo se han utilizado las ecuaciones primera y cuarta.
Nótese que se ha llegado a la ecuación de una onda a cuenta de las oscilaciones del campo vectorial E en cada punto, que tiene como rapidez de propagación la raíz cuadrada del inverso del producto de las constantes eléctrica y magnética del vacío.
De forma semejante se puede obtener un resultado análogo para el campo vectorial inducción magnética, pero trabajando a partir de la cuarta ecuación y luego tomando en cuenta las ecuaciones segunda y tercera.
Se aprecia de que en las dos ecuaciones onda para los dos campos vectoriales ambas ondas tienen la misma rapidez de propagación y que esta depende de las propiedades eléctricas y magnéticas del vacío (en este caso).
Las soluciones de estas ecuaciones que llamaremos funciones de onda: E(r,t) y B(r,t), además que deben satisfacer el conjunto de las ecuaciones de Maxwell y deben satisfacer las llamadas condiciones de frontera e iniciales.
Un caso muy interesante es el de las ondas planas que satisfacen condiciones de fronteras válidas en el infinito (esto implica una extensión infinita del tren de ondas) y con las condiciones iniciales dadas por una función sinusoidal del radio vector. Las funciones de onda para este caso son:
donde las magnitudes E0 (o B0); w; k y a0 son la amplitud de la onda (nótese que es una magnitud vectorial) y que en el SI se mide su módulo en V/m (o en T); la frecuencia angular de la onda que en el SI se mide en rad/s; el vector de onda (cuyo módulo es el llamado de número de onda que es la cantidad de ondas completas que caben en una unidad de longitud y que en el SI se mide en m-1) y la fase inicial de la onda que en el SI se mide en rad. Estas magnitudes satisfacen las siguientes relaciones:
donde f, T y l son la frecuencia lineal de la onda que en el SI se mide en Hz; el periodo que se mide en s en el SI y la longitud de onda que en el SI se mide en m.
Se cumple que siendo la fase de estas ondas (wt k× r +a0) entonces los puntos de igual fase, que llamaremos superficie de onda y que para las ondas planas son planos perpendiculares a la dirección de propagación, avanzan con una rapidez que se establece al derivar esta expresión con respecto al tiempo y sabiendo que para estos puntos la fase permanece constante, así:
donde se ha utilizado el hecho de que el vector de onda y la velocidad de fase son paralelos en el sentido estricto.
Nótese que para el medio vacío se tiene la que la rapidez de propagación de las ondas coincide con la rapidez de fase de la onda electromagnética viajera.
Estas dos ondas están en fase y esto se demuestra fácilmente al hacer cumplir por estos campos vectoriales el sistema de ecuaciones de Maxwell.
Además se cumple que los campos vectoriales al propagarse la onda oscilan en plano que son mutuamente perpendiculares y que los escalares asociados con estos campos vectoriales se relacionan entre sí de la forma siguiente: E = cB. Esta última relación implica que en la onda electromagnética tiene un vector intensidad del campo eléctrico de un módulo que es 3×108 veces mayor, salvando el hecho que sus unidades de medición no son iguales, que el módulo de la inducción magnética. Es por esta razón que al vector intensidad del campo eléctrico se le llama vector óptico.
2.10.3 Propagación de ondas electromagnéticas en el vacío, conductores y dieléctricos
Se volvemos a escribir las ecuaciones de Maxwell en las formas diferenciales para el caso de que se tenga la existencia de un dieléctrico homogéneo, isótropo y lineal, tendríamos:
Y repitiendo el proceso anterior se tiene que:
con
donde n es igual a la raíz cuadrada del producto de la constante eléctrica relativa y la constante magnética del medio dado y se denomina índice de refracción absoluto (relativo al vacío) o simplemente índice de refracción del medio.
Nótese que como la rapidez de las ondas electromagnéticas en el vacío es mayor que esta rapidez en un medio dado, el índice de refracción de cualquier medio es mayor o igual que la unidad.
Nótese que como para los materiales diamagnéticos o paramagnéticos la constante magnética es casi igual a la unidad, el índice de refracción, que nos indica cual más veloz se propaga la onda electromagnética en el vacío que en el medio dado, prácticamente solo depende de las propiedades eléctricas del material.
Para el caso de la onda plana propagándose en un medio dieléctrico la rapidez de fase mantiene la mismo dependencia con respecto la frecuencia angular y el número de onda, pero debe tomarse en cuenta que aunque la frecuencia angular no depende del tipo de medio donde se propagan las ondas, el número de onda si va a depender del medio. Se tiene que:
Para el caso de la propagación en medios conductores debemos escribir las ecuaciones de Maxwell en su forma diferencial como sigue:
Al aplicar el rotacional a la tercera de estas ecuaciones y luego utilizar las otras ecuaciones se llega a:
Para el caso de las ondas planas que se propagan en la dirección del eje de las X, se tiene que la solución para esta ecuación es de la forma:
Siendo a y b dos parámetros que dependen de la frecuencia angular de la onda y de las propiedades eléctricas, magnéticas y de conducción de la corriente eléctrica del medio dado. Como b es siempre positiva, el factor dado por la exponencial de exponente real será siempre un factor de atenuación.
En caso en que la frecuencia angular esté por debajo del rango óptico (parte del espectro electromagnético correspondiente a la luz visible (entre 4×10-7 y 7×10-7 m, lo que se corresponde con frecuencias angulares entre 2,69 y 4,71 Prad/s) se puede hacer una aproximación en la expresión para el cálculo de la magnitud b, tal que:
Este coeficiente de atenuación se puede interpretar como el inverso de la distancia en que puede penetrar la onda electromagnética en medio conductor antes de que la amplitud de la misma se reduzca en e (base los logaritmos naturales) veces. Por esta razón al inverso b se le llama profundidad del efecto "skin" (d).
Por ejemplo para el caso de la plata la conductividad eléctrica es del orden de 3×107 S/m y para ondas de frecuencia angular de 2p×1010 rad/s, que es un valor normal para las microondas, la profundidad del efecto skin es de 9.2×10-5 cm.
2.10.4. Modelo ondulatorio electromagnético de la luz
Para completar el modelo ondulatorio electromagnético de la luz, que se convierte así en la Teoría Electromagnética de la Luz, deben entre otras acciones realizarse las siguientes:
![]() | Realizar una análisis energético de tales ondas. |
![]() | Estudiar los métodos de emisión y detección de las ondas luz como ondas electromagnéticas. |
![]() | El estudio de otros tipos de ondas distintas de las planas, tales como las esféricas, etc. |
![]() | Estudiar los distintos casos de condiciones de fronteras e iniciales (pero sobre todo las primeras) para explicar los distintos fenómenos ópticos al incidir la luz sobre un dióptrico, tales como las leyes de la reflexión y la refracción, (y dentro de la ley de la refracción el caso particular de la reflexión total interna), la polarización por reflexión, el cálculo de las intensidades transmitidas y reflejadas, la birrefringencia y el dicroismo, la absorción de la luz y su carácter selectivo, etc. |
![]() | Explicar los fenómenos tales como la interferencia, la difracción y la polarización. |
![]() | Estudiar los casos particulares de las ondas estacionarias. |
![]() | Obtener las expresiones para el efecto Doppler, etc. |
El estudio de algunas de estos aspectos lo realizaremos en el resto del semestre, en particular lo que se da en llamar la Óptica Ondulatoria.
En esta ocasión culminaremos nuestro estudio con el análisis energética de las ondas electromagnéticas, en particular para el caso de las ondas viajeras.
En otras partes del curso hemos establecido que en cada punto de una región donde esté instaurado un campo electromagnético se tendrá una densidad volumétrica de energía potencial almacenada en el campo que viene dada por la expresión:
Entonces cuando una onda electromagnética avanza en el vacío o en medio dado transportará una energía.
Si tomamos la ecuación de Maxwell que contienen el operador rotacional, tercera y cuarta en la relación dada anteriormente, y realizamos el producto escalar por el campo que al que no se le está aplicando el rotacional y luego restamos obtenemos:
y
Restando la primera de estas ecuaciones a la primera se tiene:
donde se ha utilizado la equivalencia para la divergencia de un producto vectorial y además se ha aprovechado las relaciones entre los vectores D y E, por un lado y H y B por otro (para esto solo se requiere que en los casos más complejos los elementos de los tensores que están involucrados en estas relaciones no dependan del tiempo).
Si ahora se integra para un volumen V dado y constante en el tiempo y que está limitado por la superficie cerrada S y se aplica el teorema de la divergencia se tiene que:
donde se ha aprovechado el hecho de que el volumen por el que se integra es constante en el tiempo para pasar de la derivada temporal parcial del integrando, en la primera integral del miembro del derecha, por la derivada total temporal de la integral de volumen sin derivar el integrando, que es la densidad de energía del campo electromagnético.
En la interpretación de este resultado se tiene que el miembro de la izquierda significa la energía transferida hacia el campo electromagnético a través del movimiento de portadores de carga (recuérdese que la densidad de corriente es proporcional a la velocidad con que se desplazan esos portadores). Cuando en el sólido de volumen V no existen fuentes de fem, entonces este miembro es intrínsecamente negativo y es igual a la energía por unidad de tiempo (potencia) disipada por efecto Joule Lenz. Este miembro, sin embargo puede ser positivo cuando existen otros mecanismos, no electromagnéticos que le entreguen energía al campo electromagnético. En cuanto a los dos sumandos del miembro de la derecha, la integral de volumen indica como cambia en el tiempo la energía almacenada en el campo electromagnético en el volumen V y la integral de superficie significa la energía electromagnética que atraviesa la superficie cerrada que limita el volumen. Esta energía atraviesa esta superficie transportada por el propio campo electromagnético y una de esas formas es con las ondas electromagnéticas.
El vector S = E ´ H es llamado vector de Umov Poynting y su módulo tiene las dimensiones de energía por unidad de superficie perpendicular a la dirección en que se transporta la energía y por unidad de tiempo. En el SI se mide en W/m2. La dirección y el sentido de este vector, en el caso de las ondas electromagnéticas, son la dirección y el sentido de propagación de la onda electromagnética.
La ecuación anterior por tanto es una expresión de la Ley de Conservación y Transformación de la Energía para un volumen fijo.
2.10.5 Conclusiones
2.11 Luz polarizada y superposición de luz polarizadaCon esto elementos sobre la Teoría Electromagnética de la Luz se puede emprender el estudio de los casos más complejos con diversos medios y con las más variadas condiciones de fronteras y abordar los fenómenos de emisión, transmisión y recepción de las ondas electromagnéticas que tienen información codificada, digitalizada o no, y de amplio uso en las Telecomunicaciones y en la Informática.
Introducción
2.11.1 Discusión inicial
Se discutirán las siguientes afirmaciones:
1. Fenómeno de polarización de la luz. Polarización por reflexión y refracción. Ley de Brewster
Son varios los tipos de fenómenos en los que participa la luz donde se manifiesta su carácter de onda electromagnética. A la parte de la Física que estudia este tipo de fenómenos se le llama Óptica Ondulatoria.
Un grupo de estos fenómenos se engloban para su estudio bajo el nombre de polarización de la luz.
Como la luz es una electromagnética transversal esta puede ser polarizada. Esto se refiere a que como el plano de oscilación del vector óptico contiene la dirección de propagación y existen infinitos de estos planos de modo que la diferenciación de alguno de estos planos establece determinado tipo de polarización de la luz.
Los estados de polarización de la luz son los siguientes:
![]() | Lineal o plano polarizada: se trata de la luz cuyo vector eléctrico oscila siempre en
uno y solo uno de los infinitos planos que contienen a la dirección de propagación. Otra forma de describir este estado de polarización es señalando que la probabilidad de hallar al vector óptico en uno de los infinitos planos que contienen a la dirección de propagación de la onda es en todo momento igual a 1 y se mantiene con valor cero en todos los demás planos. A este plano en el cual oscila el vector E se le llama plano de oscilación del vector E. En tanto, al plano perpendicular al anterior, es decir, al plano en que oscila el vector inducción magnética se le llama plano de polarización. (Esta anomalía en los nombres tiene un origen histórico). Existe aún otra forma de describir este estado de polarización y es la siguiente: la luz será lineal o plano polarizada si la proyección del vector óptico sobre un plano frontal a la dirección de propagación describe un segmento de recta (de ahí el nombre de linealmente polarizada). |
![]() | Circularmente polarizada: se trata de la luz cuyo vector óptico oscila en un plano que contiene a la dirección de propagación y que gira sobre la dirección de propagación con una rapidez angular numéricamente igual a la frecuencia angular de la onda y siempre manteniéndose constante el módulo del vector E. Esto significa que la probabilidad medir E en un instante dado es igual a la unidad en un plano dado y cero en todos lo demás planos que contienen a la dirección de propagación y un tiempo después igual a Dt la probabilidad de medir a E en primer plano es cero y solo será igual a la unidad en un plano que forma un ángulo igual a wDt con el primero de los planos. Además el módulo de E no varía al encontrarlo en cualquier plano. Esto significa que la proyección del extremo del vector óptico describe una circunferencia de radio igual al módulo del vector E sobre un plano frontal a la dirección de propagación de la luz y esa proyección va girando sobre esa circunferencia con una rapidez angular numéricamente igual a la frecuencia de la luz. |
![]() | Elípticamente polarizada: ahora tendríamos un haz de luz cuyo vector óptico realiza oscilaciones semejantes al caso de la luz circularmente polarizada, pero su módulo no permanece constante y cambia con arreglo a una ley elíptica al ir rotando el plano en el que la probabilidad de hallar al vector E se va haciendo igual a la unidad. Esto significa que la proyección del extremo del vector óptico sobre un plano normal a la dirección de propagación describe una elipse de semiejes iguales al valor máximo y mínimo del módulo del vector E. Esa proyección recorre por completo la elipse en un tiempo igual al periodo de la onda luminosa. |
![]() | Elípticamente polarizada de semiejes que rotan: todo es semejante al caso anterior, pero ahora los valores máximos y mínimos del módulo de E no se reproducen en los mismos dos planos perpendiculares entre sí y que contienen a la dirección de propagación, sino que los planos en los que se producen estos valores extremos del módulo de E van rotando alrededor de la dirección de propagación con una rapidez angular igual a W (distinta en general del valor numérico de la frecuencia angular de la onda luminosa. |
![]() | No polarizada: esta es la radiación luminosa cuyo vector óptico oscila de forma tal que puede ser hallado en cualquiera de los infinitos planos que contienen a la dirección de propagación, pero a la vez solo en uno de ellos. Entonces la proyección del extremo del vector óptico sobre un plano normal a la dirección de propagación realiza una movimiento de vaivén desde el punto en que la dirección de propagación penetra el este plano perpendicular a ella hasta un valor que es igual al módulo del vector E y luego hasta ese origen. Pero al comenzar otro medio ciclo la oscilación en general se produce en otro cualquiera de los infinitos planos que contienen a la dirección de propagación. Al producirse las oscilaciones en planos distintos la amplitud de las oscilaciones del vector óptico permanece constante o cambia alrededor de un valor medio de forma totalmente aleatoria. |
![]() | Luz parcialmente polarizada: es semejante a la no polarizada en lo relacionado con la indistinguibilidad del plano en el cual oscilaría E, pero ahora al oscilar en un plano dado lo hará con una amplitud máxima y en un plano perpendicular al anterior la amplitud sería mínima y esos planos con los valores extremos de la amplitud serían fijos. |
En muchos textos se le llama luz natural a la no polarizada, pero esto no es tan real. En realidad la luz natural es parcialmente polarizada pues sufre reflexiones y como veremos más tarde la luz reflejada es parcialmente polarizada e incluso linealmente polarizada, o por los átomos como fuentes de luz que emiten luz polarizada (como en una fuente extensa de luz emiten muchos átomos la luz que emite este tipo de fuente es luz parcialmente polarizada).
Nótese que la luz parcialmente polarizada en el límite cuando el valor mínimo del módulo del vector E va tendiendo a cero.
Veamos ahora una de las formas en que se puede obtener luz lineal y parcialmente polarizada.
De la aplicación de las llamadas Fórmulas de Fresnel; que obtenidas a partir de las condiciones de frontera en un dióptrico para los campos vectoriales D, E, B y H relacionan las amplitudes de las oscilaciones de estos campos en los estados de polarización de las ondas incidente, reflejada y transmitidas en dióptrico, estados de polarización que serían: uno con las oscilaciones de E perpendiculares al plano de incidencia y el otro con las oscilaciones de E contenidas en el plano de incidencia; se llega, entre otros resultados, al contenido de la llamada Ley de Brewster que permite explicar el estado de polarización de las ondas reflejadas y transmitidas en un dióptrico. Esta ley expresa que si a un dióptrico llega luz no polarizada con un ángulo de incidencia igual al ángulo de Brewster o ángulo de polarización total, dado por q 1p=tan-1(n2/n1), donde n2 es el índice de refracción del medio hacia el cual se refracta la luz y n1 es el índice de refracción del medio desde el cual incide la luz sobre el dióptrico (al cociente de ambos índices se le llama índice de refracción relativo del medio 2 con respecto al medio 1), entonces la luz reflejada está linealmente polarizada de tal forma que el vector eléctrico oscila en un plano perpendicular al plano de incidencia. En tanto en el rayo reflejado esta componente es la única presente, en el rayo refractado estarán presente esta componente, pero disminuida, y la componente en la que el vector óptico oscila en el propio plano de incidencia y por esto la luz transmitida estará parcialmente polarizada con el plano en el cual se obtiene el máximo en el valor de la amplitud de las oscilaciones de E paralelo al plano de incidencia. Cuando se va variando el ángulo de incidencia y nos vamos alejando del valor arriba indicado, tanto por encima como por debajo de este valor, la luz reflejada se va convirtiendo de luz linealmente polarizada en luz parcialmente polarizada con el plano en el cual se obtiene el máximo en el valor de la amplitud de las oscilaciones de E perpendicular al plano de incidencia, en tanto la luz refractada será cada vez menos parcialmente polarizada y se acercará ser luz no polarizada (a este estado solo llega cuando la incidencia es de 0º).
Así la aplicación de esta ley permite obtener luz linealmente polarizada por reflexión, para lo que solo hay que hacer coincidir el ángulo de incidencia con el ángulo de polarización total, y por refracción, para lo que se debe hacer es disponer una pila de láminas planoparalelas y paralelas entre sí para ir aumentando la componente de luz planopolarizada tal que su vector E vibre en un plano paralelo al plano de incidencia.
2.11.3 Birrefringencia y dicroismo. Ley de Malus
Existen determinados materiales en los cuales al incidir la luz se producen dos rayos refractados y este fenómeno se denomina birrefringencia o doble refracción. En esencia este fenómeno se debe a las anisotropías del material. Esto significa que cuando ocurre que la rapidez de propagación de la luz en el interior del material dado depende del plano en el que oscila el vector óptico se tiene un material birrefringente y producto de esto el índice de refracción que presenta el medio birrefringente para un rayo en cuestión dependerá del estado de polarización de la luz y más concretamente del plano en que oscile su vector E y así en general se formarán dos rayos refractados: uno, llamado rayo ordinario, y el otro, rayo extraordinario.
Se le llama eje óptico a la dirección (y todas las direcciones paralelas a ella) en el interior del material birrefringente y que está sólidamente ligada a él, en la cual todos los rayos de luz tendrían la misma rapidez de propagación con independencia de cual sea el plano en el que vibra el vector óptico.
Unos tipos de materiales birrefringentes tienen un solo eje óptico y se les llaman cristales uniáxicos y otros tiene dos ejes ópticos que en general forman un ángulo determinado para cada tipo de estos materiales a los cuales se les llama cristales biáxicos. En nuestro estudio nos ocuparemos de los cristales uniáxicos.
Se llama sección principal o plano principal del cristal para un rayo (por ejemplo para el rayo ordinario o para el rayo extraordinario) al plano que estando fijo al cristal contiene a la dirección del rayo del que se trate en el interior del cristal y al eje óptico del cristal. En general la sección principal para los rayos ordinario y extraordinario no son paralelas.
Se tiene que el estado de polarización de los rayos ordinarios y extraordinarios en el seno de un material birrefringente es siempre linealmente polarizado y que el plano de oscilación del vector óptico en el rayo ordinario es siempre un plano perpendicular a la sección principal del cristal para ese rayo, en tanto para el rayo extraordinario su vector E oscila siempre en un plano paralelo a la sección principal del cristal para ese plano.
Por otra parte se tiene que para el rayo ordinario el material se comporta como si fuera isótropo, esto es, la rapidez de propagación del rayo ordinario en el seno del cristal birrefringente es constante y no depende de la dirección de propagación del raro, lo que hace que el índice de refracción del medio para este rayo, no, sea constante y eso significa que al refractarse el rayo que en el seno del material se corresponde con el rayo ordinario siempre se cumple la ley de la refracción y de ahí el nombre de ordinario de este rayo. Por esta razón las superficies de onda a partir de una fuente puntual de luz en el interior del cristal birrefringente para estos rayos serán esferas concéntricas con el punto de emisión. Mientras para el rayo extraordinario la rapidez de propagación dependerá de la dirección de propagación del mismo y por ello el índice de refracción del cristal para este rayo, ne, no es constante. Estos rayos extraordinarios no satisfacen en general la ley de la refracción. Además las superficies de onda de los rayos extraordinarios en el seno de un material birrefringente se corresponden con la superficie de un elipsoide de revolución en el caso de los cristales uniáxicos cuyo eje de simetría en paralelo al eje óptico del cristal que pasa por el punto de emisión. Así cuando la dirección de propagación del rayo extraordinario es la dirección del eje óptico ocurrirá el máximo o un mínimo en el valor de la rapidez de propagación (o un mínimo o un máximo del índice de refracción ne); en el primer caso se les llama a los cristales negativos y en el segundo, positivos.
Se llama coeficiente de birrefringencia o índice de birrefringencia o birrefringencia a la diferencia ne extermo no. Nótese que este coeficiente es positivo para los cristales positivos y negativo para los cristales negativos. (Como el índice de refracción de una sustancia depende de la longitud de onda, los valores que habitualmente se reportan son para el doble del sodio (589 y 589,6 nm)).
Ahora se podrían buscar formas alternativas de definir el eje óptico de un cristal birrefringente uniáxico. El eje óptico será la dirección en el cristal en la cual los índices de refracción del cristal para ambos rayos y las rapideces de propagación de ambos rayos serán iguales. El eje óptico de un cristal birrefringente uniáxico será la dirección en que las superficies de onda de las ondas ordinarias y extraordinarias emitidas a partir de una misma fuente puntual en el seno del cristal, son tangentes y además se constituye en eje de rotación del elipsoide de revolución cuya superficie representa a una superficie de onda de la onda extraordinaria.
El Principio de Huygens permite dibujar las superficies de las ondas ordinarias y extraordinarias de los rayos refractados al incidir luz no polarizada sobre un cristal birrefringente, siempre que se conozca la dirección de su eje óptico y sí el cristal es positivo o negativo. Este principio dice que cada punto de una superficie de onda es un emisor de ondas secundarias y que la nueva superficie de la onda es la envolvente a todas las superficies de ondas secundarias en un instante dado. Además el rayo o dirección de propagación de esta onda será la recta orientada que partiendo del punto de emisión llega a punto de tangencia entre la superficie de la onda secundaria correspondiente y la superficie de la onda principal construida como la envolvente de todas las superficies de las ondas secundarias.
Veamos un ejemplo:
Dentro de la clasificación de los materiales birrefringentes se encuentran los llamados materiales dicroicos en los cuales además de estar presente la propiedad de ser birrefringentes ocurre que el material absorbe de forma muy distintas a los rayos ordinario y extraordinario, siendo muy fuertemente absorbido uno de ellos en tanto para el otro la absorción es casi despreciable. Esta propiedad de se debe a la conjunción de las anisotropías del material que producen la aparición de ambos tipos de rayos y luego la absorción selectiva para los rayos de la luz según su estado ce polarización.
Esta propiedad puede ser aprovechada para obtener luz linealmente polarizada y para estudiar el estado de polarización que pueda tener un determinado rayo de luz.
Cuando se prepara una lámina de un cristal birrefringente uniáxico de modo que su eje óptico quede paralelo a la superficie de la lámina y la incidencia de la luz se produce normalmente por esa superficie los rayos ordinario y extraordinario mantienen la misma dirección (aunque se retrasa uno con respecto al otro como veremos después) y si además la lámina es dicróica entonces la luz emergente tendrá preponderantemente la componente cuyo estado de polarización es la que vibra en un plano paralelo al eje óptico o en un plano perpendicular al eje óptico de la lámina (esto depende de que tipo de absorción dicróica presente el material, si la de absorber intensamente el rayo ordinario o el rayo extraordinario). A esta lámina dicróica se le llama filtro polarización por absorción.
Consideremos el caso del filtro polarizador dicróico ideal que sería aquel que la absorción del otro rayo es despreciable y además las pérdidas por reflexión sean tan pequeñas que se puedan considerar nulas. A la dirección ligada al filtro y que al incidir luz cuyo vector oscile paralelamente a la ella ese rayo no es absorbido, se le llama eje de transmisión del filtro polarizador. Nótese que el eje de transmisión es paralelo al eje óptico o perpendicular a él.
Se puede enunciar el contenido de la llamada Ley de Malus de la siguiente forma:
Si sobre un filtro polarizador por absorción ideal incide normalmente un haz de luz linealmente polarizada cuyo vector E oscila en un plano de los que contienen a la dirección de propagación que forma un ángulo q con el eje de transmisión del filtro polarizador, entonces solo la componente de las oscilaciones que son paralela al eje de transmisión del filtro, por esta razón la amplitud de las ondas transmitidas será tal que:
Como la intensidad la luz es proporcional al cuadrado del módulo de la amplitud de las oscilaciones del vector E se tiene que:
Además la luz emergente es linealmente polarizada y el vector óptico vibra en el plano que contiene al eje de transmisión del filtro de los infinitos planos que contienen a la dirección de propagación.
Para el caso que la luz incidente sea luz no polarizada, debido a la igualdad de probabilidad de hallar al vector óptico de la luz incidente en cualquiera de los infinitos planos que contienen al dirección de propagación, el ángulo entre el vector E de la luz incidente y el eje de transmisión del filtro polarizador tendrá igual probabilidad de tomar valores entre 0º y 90º lo que significa que el valor medio de la intensidad de la luz transmitida es:
En cuanto al estado de polarización de la luz emergente esta es linealmente polarizada con el vector óptico vibrando en el plano que contiene al eje de transmisión del filtro polarizador y a la dirección de propagación.
Para el caso de que la luz incidente sea circularmente polarizada el resultado del cálculo de la intensidad de la luz transmitida es equivalente al del caso anterior, pero la causa es otra porque ahora no se trata de que el ángulo entre el vector óptico de la onda incidente y el eje de transmisión del filtro tome cualquier valor, sino que este ángulo va tomando, al rotar el plano en el que se encuentra el vector óptico de la onda incidente, entre 0º y 90º. El estado de polarización es análogo al de los otros dos casos vistos anteriormente.
Faltarían los casos de que sobre el filtro polarizador incida luz elípticamente polarizada, de los dos tipos, y luz parcialmente polarizada. Puede quedar para los alumnos la investigación de lo que acontecería en estos casos.
Todos estos casos pueden ser conceptualizados como la Ley de Malus (aunque realmente se cumple esta ley no tan solo para los filtros polarizadores por absorción, sino también para el caso de los llamados prismas de Nicols e incluso para la luz linealmente polarizada por medio de reflexión de Brewster).
2.11.4 Láminas birrefringentes
Veamos ahora cómo se puede obtener luz con los demás estados de polarización.
Para ello primero estudiemos la superposición de dos ondas planas monocromáticas y de igual frecuencia que sean linealmente polarizadas y que los planos en los que oscilan sus respectivos vectores ópticos sean perpendiculares entre sí.
Supongamos que ambas ondas avanzan en un mismo medio en el sentido positivo del eje de las Z, entonces se tendrá:
donde Ex0 y Ey0 son las correspondientes amplitudes de las ondas y ax0 y ay0 son las correspondientes fases iniciales.
De estas funciones de onda se puede llegar a las expresiones:
y
Si multiplicamos la primera de estas expresiones por cos(ay0) y la segunda por cos(ax0) y restamos se tiene:
donde Dj es la diferencia de fase entre las dos ondas. Como se trata del mismo medio homogéneo y ambas ondas son monocromáticas y de igual frecuencia angular, la diferencia de fase solo viene dada por la diferencia de fase inicial.
Realizando ahora unas operaciones semejantes, pero multiplicando esta vez las correspondientes ecuaciones por sen(ay0) y sen(ax0), se tiene:
De modo que elevando al cuadrado estas expresiones y sumando se llega a que:
Que es la ecuación de la curva que describe la proyección, sobre un plano normal a la dirección de propagación, del vector eléctrico de la onda que se forma de la superposición de estas dos ondas cuyos vectores ópticos vibran en planos mutuamente perpendiculares y que son monocromáticas y con el mismo valor de la frecuencia angular.
Aquí debemos analizar que se cumple el Principio de Superposición que establece que cada una de las ondas viajeras que llegan a un tiempo a un punto dado de una región continua su propagación sin afectar sus parámetros debido a la acción de las otras ondas. Esto significa que en ese punto de encuentro los vectores que caracterizan al campo electromagnético se suman y así se obtiene la perturbación electromagnética resultante:
Y que:
donde |E| es el módulo del vector E que es el vector óptico de la onda resultante de la superposición de las dos ondas y q es el ángulo que forma este vector con el eje de las X.
Volviendo a la expresión para la curva que describe el extremo del vector óptico de la onda resultante sobre un plano frontal a la dirección de propagación, tenemos que se trata de la ecuación de una elipse que en general sus semiejes giran con una rapidez angular que puede ser determinada de los mismos parámetros de la ecuación.
Veamos algunos casos notables para los valores de los parámetros de esta ecuación.
Caso A.
La diferencia de fase es un número entero de 2p.
[Dj = 2mp, con m = 0; 1; 2; 3; ...].
Así se tiene que la ecuación se reduce a:
Que es la ecuación de una recta con pendiente dada por el cociente de las amplitudes de los vectores ópticos de las correspondientes ondas linealmente polarizadas cuyos vectores ópticos oscilan en planos mutuamente perpendiculares, ondas que son monocromáticas y de igual frecuencia y se propagan y surperponen en un medio homogéneo y cuya diferencia de fase no depende del tiempo. Nótese que en este caso se tiene que:
Que permanece constante en el tiempo.
Entonces para este caso la onda luminosa resultante será linealmente polarizada y su vector óptico oscilará en un plano que forma un ángulo q, dado por la expresión anterior, con el eje positivo de las X.
Caso B.
La diferencia de fase es un número entero impar de p.
[Dj = (2m+1)p, con m = 0; 1; 2; 3; ...].
Así se tiene que la ecuación se reduce a:
que también es la ecuación de una recta cuya pendiente es ahora negativa, lo que señala que el plano en el que oscila el vector óptica de la onda resultante de la superposición está formando un ángulo con el eje positivo de la X tal que las oscilaciones de E se producen en el segundo y cuarto cuadrantes. Esto es equivalente a decir que ese plano forma un ángulo igual q con el eje positivo de las X.
En este caso también ese ángulo y su tangente no dependen del tiempo y la onda resultante es linealmente polarizada.
Caso C.
La diferencia de fase es un número entero impar de p/2.
[Dj = (2m+1)p /2, con m = 0; 1; 2; 3; ...]
Así se tiene que la ecuación se reduce a:
Nótese que para estos casos se tiene que:
con m = 0; 1; 2; 3; ...
De esta expresión se aprecia que el ángulo entre el plano en que oscila el vector óptico de la onda resultante con el eje positivo de las X, cambia a un ritmo igual a la frecuencia angular de las ondas. Nótese que el signo de esta expresión está asociado a sí el giro de ese plano es a la derecha o la izquierda.
Sub caso C1.
Si las amplitudes de las ondas linealmente polarizadas que se superponen son iguales, entonces se llega a la ecuación de una circunferencia de radio Ex0 = Ey0. De esta forma la onda resultante de la superposición sería circularmente polarizada.
Sub caso C2.
Si las amplitudes son distintas en general se obtendrá la curva de una elipse con los semiejes paralelos a los ejes coordenados X y Y. El semieje mayor y el menor estará en función de cual de las dos amplitudes de las ondas que se superponen será mayor.
Entonces se tendrá que la onda resultante será elípticamente polarizada de semiejes que no giran.
Caso D.
En cualquier otro caso de para el valor de la diferencia de fase se tendrá luz elípticamente polarizada de forma que los semiejes de la elipse que describe la proyección del extremo del vector óptico de la onda resultante no serán paralelos a los ejes coordenados perpendiculares a la dirección de propagación.
Cuando se superponen ondas linealmente polarizadas en planos mutuamente perpendiculares y que sean monocromáticas, pero de frecuencias angulares distintas, la resultante será una onda elípticamente polarizada de semiejes que rotan. Se puede establecer la rapidez de giro de los semiejes en función de la diferencia entre las frecuencias angulares de ambas ondas.
Se puede llegar a las consideraciones siguientes: si dos ondas sinusoidales planas y monocromáticas y de igual frecuencia se propagan en la misma dirección y sentido en un medio homogéneo e isótropo y esas ondas son linealmente polarizada de forma que los planos en que vibran los respectivos vectores ópticos sean perpendiculares entre sí, se obtiene en general, producto de la superposición, un onda de igual frecuencia que las dos que se superponen y que se propaga en la misma dirección y el mismo sentido que aquellas y cuyo estado de polarización dependerá de la diferencia de fase y en última instancia de la diferencia de fase inicial entre las dos ondas que se superponen.
Veamos como se puede lograr en la práctica obtener las referidas ondas que al superponerse permiten obtener el estado de polarización deseado.
Si se talla una lámina de espesor d y compuesta de un material birrefringente de coeficiente de birrefringencia (ne no) y no dicróico de forma tal que el eje óptico quede paralelo a las caras de la lámina y se hace incidir normalmente a una de las caras de la lámina luz linealmente polarizada de tal forma que el plano en que oscila el vector óptico de la onda incidente forme un ángulo (sujeto a cambio o ajuste) q con el eje óptico de la lámina, los rayos ordinario y extraordinario se mantendrán propagándose en la misma dirección, pero de forma que a la salida de la lámina entre ellos habrá una diferencia de fase igual a:
siendo l la longitud de onda media en el vacío y de el espesor de la lámina.
Debido al retraso entre la onda ordinaria y la extraordinario que introduce este tipo de lámina se les llama lámina retardadora.
Por otro lado como los dos rayos en el seno de la lámina retardadora se forman a partir de una mismo onda monocromática, tanto el rayo ordinario como el extraordinario serán monocromáticos y con la misma frecuencia. Además las secciones principales del cristal para ambos rayos coinciden y esto provoca que ambos rayos, que siempre son linealmente polarizados, en esta situación tienen los respectivos planos en los que oscilan los correspondientes vectores ópticos, sean perpendiculares entre sí.
Se pude construir, entonces, la siguiente tabla:
Tipo de lámina | Condición para la diferencia de fase |
Condición para la diferencia de camino ![]() |
q | Descripción |
Onda completa | 2mp, con m = 1; 2; 3; ... |
ml m = 1; 2; 3; ... |
* | La luz emergente es linealmente polarizada y el plano de vibración de E es el mismo que el de la onda incidente para cualquier valor de q. |
Medio onda | (2m+1)p m = 0; 1; 2; ... |
(2m+1)l/2 m = 0; 1; 2; 3; ... |
* | La luz emergente es linealmente polarizada y el plano de vibración de E forma un ángulo igual a 2q, barriendo sobre el eje óptica de la lámina, con el plano en que oscila el vector E de la onda incidente para cualquier valor de q. |
Cuarto de onda | (2m+1)p/2 m = 0; 1; 2; 3; ... |
(2m+1)l/2 m = 0; 1; 2; 3; ... |
45º | La luz emergente es circularmente polarizada. |
0º | La luz emergente es linealmente polarizada y el plano de vibración de E es el mismo que el de la onda incidente. | |||
90º | La luz emergente es linealmente polarizada y el plano de vibración de E es el mismo que el de la onda incidente. | |||
Eoc | La luz emergente es elípticamente polarizada |
El asterisco indica que el valor de q puede ser cualquiera entre 0º y 90º.
2.11. 5 Conclusiones
La luz son una ondas electromagnéticas que en los medios homogéneos, isótropos y lineales son ondas transversales ellas son capaces de mostrar distintos estados de polarización.
Y por otro lado muchos de los fenómenos de interacción de esas ondas luminosas con las sustancias y los cuerpos depende del tipo de polarización que presenten las ondas incidentes, dando como resultados, entre otros fenómenos, cambios en el estado de polarización de la luz emergente de los cuerpos con los cuales ella interaccionó y cambios en la intensidad de la luz emergente con relación a la intensidad de la luz incidente.
Estos hechos permiten utilizar la luz, su intensidad y su estado de polarización, para estudiar distintos objetos, cuerpos y sustancias. Esto permite una amplia gama de utilización de las propiedades de polarizabilidad de la luz, tanto en ramas de las ciencias como en aplicaciones en las tecnologías.
Algunos ejemplos de lo anterior son los polarímetros, que son dispositivos que permiten medir la rotación del plano de vibración del vector óptico de la onda emergente que atravesó un determinado espesor de una sustancia ópticamente activa, esto es que tiene la propiedad de hacer rotar este plano, con respecto a plano de vibración del vector óptico de la onda linealmente polarizada incidente. Un caso particular de este dispositivo es el sacarímetro, que permite medir la concentración de esta sustancia en el jugo de la caña de azúcar bajo el mismo principio pues la sacarosa es ópticamente activa. Otros ejemplos notorios son todos las aplicaciones de la superposición de luz polarizada que ha pasado por un modelo de un plástico de piezas de acero que trabajan en determinado mecanismo y de esta forma hacer un estudio sobre la distribución y concentración de tensiones en el modelo que brindan información sobre esos mismos aspectos sobre la pieza como tal. También en la microscopía óptica existen múltiples aplicaciones de la polarización de la luz.
Estos son solo algunos ejemplos de esta gama de aplicaciones.
Introducción
Entre los fenómenos en los que se manifiesta la naturaleza ondulatoria electromagnética de la luz se encuentran los de la interferencia de la luz.
La interferencia es consecuencia de la superposición de ondas coherentes dando como resultado un patrón interferencial que tiene distintas formas de manifestarse en dependencia del tipo concreto de dispositivo mediante el cual, al interaccionar la luz con él, se obtiene ese patrón.
Para que se produzca el fenómeno de la interferencia de la luz deben superponerse dos o más rayos luminosos que sean coherentes. Es por ello que una de las clasificaciones de estos fenómenos tiene que ver con la forma de obtención de los rayos que, siendo coherentes, se van a superponer. Así se tiene la interferencia por división del frente de onda y por división de la amplitud.
En este apartado además de las definiciones sobre el fenómeno como tal se estudiarán las condiciones ideales y reales para la coherencia y las condiciones generales y particularizadas en varios de los dispositivos de interferencia de máxima y mínima intensidad en el patrón de interferencia.
2.12.1 Discusión inicial
Estas afirmaciones deben ser analizadas por Ud. para ver qué tan ciertas son en todo lo que plantean o en parte de lo que se expresa.
2.12.2 Fenómeno de interferencia de la luz. Condiciones ideales y reales de coherencia de la luz
Son varios los tipos de fenómenos en los que participa la luz donde se manifiesta su carácter de onda electromagnética. A la parte de la Física que estudia este tipo de fenómenos se le llama Óptica Ondulatoria.
Entre los más importante grupos de fenómenos están los relacionados con la llamada Interferencia de la Luz o Interferencia Luminosa.
Analicemos el caso de la superposición de dos ondas planas, monocromáticas y de igual frecuencia, sinusoidales, linealmente polarizadas y que los planos de vibración de los respectivos vectores eléctricos coincidan y que las direcciones de propagación sean aproximadamente iguales y que son emitidas por dos focos puntuales S1 y S2 muy alejados del punto donde se superponen ambas ondas, entonces se puede realizar la siguiente figura:
de la cual y según el principio de superposición se tiene que:
donde Dj es la diferencia de fase entre las dos ondas. Como las dos ondas son monocromáticas y de igual frecuencia la diferencia de fase dada por [k(r2r1)+(a1a2)] permanece constante en el tiempo para cada punto que esté situado a las distancias r1 y r2 de los correspondientes focos puntuales.
Como de la gráfica se tiene que:
Debido a la ley de los cosenos.
También de la gráfica:
Y entonces se tiene:
donde se ha aprovechado la proporcionalidad entre la intensidad de la onda luminosa y el cuadrado de la amplitud de la onda.
Para el caso en que las amplitudes, y por ende la intensidad de ambas ondas que se superponen, son iguales, se tiene:
donde b es la mitad de la diferencia de fase entre las dos ondas que se superponen e I0 es la intensidad de la luz debido a uno solo de los rayos interferentes (cuando el otro rayo es suprimido) y a la vez es la cuarta parte de la intensidad en el punto donde la diferencia de fase sea nula o un múltiplo de 180º.
De este resultado se aprecia que la intensidad de la luz no se distribuye monótonamente al variar la posición del punto donde se estudia la superposición de las ondas. Se nota que la dependencia entre la intensidad de la luz en los puntos donde se produce la superposición con el ángulo de la diferencia de fase (mejor con la mitad de ese ángulo) es a través de una función coseno al cuadrado.
Así se llega a:
con E0 dado por la ecuación anterior correspondiente y con
siendo r la posición promedio entre r1 y r2 y a es la fase inicial de las oscilaciones del vector óptico resultante en ese punto
Veamos ahora, a manera de resumen cuáles son las condiciones que deben satisfacer los dos rayos que interfieren. A estas condiciones les llamaremos condiciones ideales de coherencia entre los dos rayos.
Dos rayos de luz son coherentes totalmente sí:
![]() | Ambas ondas son monocromáticas y tienen igual frecuencia. |
![]() | Las fases iniciales permanecen constantes en el tiempo de modo que la diferencia de fase inicial permanece constante en el tiempo. |
![]() | Ambas ondas son linealmente polarizadas y sus correspondientes vectores ópticos vibran en el mismo plano. |
![]() | Los rayos de luz provienen de fuentes puntuales. Por puntuales se toman las fuentes que cumplen la condición b<<D(l/d), siendo b dimensión característica de la fuentes; D es la distancia a cual se estudia el patrón de interferencia desde las fuentes y d es la separación entre las fuentes. |
Cuando se satisfacen estas condiciones ideales de coherencia el patrón interferencial es visible y estacionario en el tiempo. Las dos primeras de estas condiciones hacen que se cumpla que la diferencia de fase permanezca constante en el tiempo. A esta condición sumaria se le llama condición fundamental de coherencia.
Entonces para el patrón interferencial se pueden expresar las condiciones de máxima y mínima intensidad luminosa en términos de la diferencia de fase entre las ondas coherentes que se superponen o términos de la diferencia de camino óptico entre los dos rayos en su recorrido desde la fuente (puntual) hasta el punto de superposición. Para obtener unas condiciones de las otras, se utiliza la relación Dj =(2p/l)Dl, donde Dl es la diferencia de camino óptico.
El fenómeno de la interferencia luminosa se puede observar aún cuando no se cumplan estrictamente las condiciones ideales de coherencia. Para estos casos en que aún existe y es observable el patrón de interferencia se dice que se cumplen las llamadas condiciones reales o parciales de coherencia. Veamos estas condiciones:
![]() | Las ondas pueden ser cuasi monocromáticas en el sentido que cada una tiene un ancho de banda Dw (o Dl), pero los "centros" de esas frecuencias han de ser los mismos: w 1 = w 2. |
El rango admisible está relacionado con el concepto de longitud de coherencia.
Llamemos longitud de coherencia a la magnitud Lc = l2/D l. Entonces siempre que la diferencia de camino óptico entre los rayos sea mucho menor que la longitud de coherencia (Dl = l2/Dl) el patrón existirá y será visible. Esto es equivalente a que el orden de los máximos sea mucho menor que l/Dl. Asociado con el concepto de longitud de coherencia se tiene el concepto de tiempo de coherencia tc, tal que se cumple que Lc = ctc. esto permite asegurar que dos ondas cuasi monocromáticas que al superponerse en un punto hayan sido emitidas por los correspondientes focos con una diferencia de tiempo menor que el tiempo de coherencia el patrón existe y es visible. (Esto último está relacionado con la constancia de la diferencia de fase inicial.)
Se puede introducir el coeficiente llamado grado de coherencia tal que:
donde g es el grado de coherencia que vendrá dado por:
Como se aprecia la visibilidad del cuadro interferencial dependerá del grado de coherencia.
![]() | Los haces de luz incumplen la condición en cuanto al estado de polarización, ya sea porque siendo linealmente polarizados, los planos en que vibran sus correspondientes vectores ópticos forman en general un ángulo f diferente de cero, pero pequeño; o porque son elípticamente polarizados de iguales características o porque sean formados por luz no polarizada. E todos estos caso el grado de coherencia se verá afectado por un factor de multiplicación que será función de un ángulo determinado según el caso: |
- Para luz linealmente polarizada cuyos planos de vibración de los correspondientes vectores ópticos formen un ángulo f, el factor de multiplicación que afectará a g será cosf.
- Para los casos en que los rayos a interferir sean elípticamente polarizados con las mismas características o no polarizados y siendo f el ángulo que forman las direcciones de propagación en el punto en que se produce la superposición, el factor será (1+ cosf)/2.
2.12.3 Experimento de Young
Uno de los dispositivos, en los cuales se puede observar la interferencia de dos haces coherentes o parcialmente coherentes, es el dispositivo de Young o de la doble abertura.
Este dispositivo cuenta con, el orden en que la luz pasa a través de sus partes, una pantalla opaca que tiene una ranura de ancho muy pequeño, que en muchas ocasiones es regulable y cuya función es garantizar la coherencia parcial, al menos de las ondas; un filtro de absorción lectiva cuya función es lograr la cuasi monocromaticidad de las ondas; una segunda pantalla opaca con dos ranuras muy estrechas y juntas situadas a una distancia de una de la otra y paralelas a la rendija de la primera pantalla, que es propiamente el dispositivo de la doble abertura, y cuya función es producir por división de las superficies de onda y una última pantalla opaca que está a una distancia D, grande, de la doble abertura y que cuya función es hacer recoger el patrón. Esta última pantalla puede ser sustituida por el plano donde se forma la imagen en un ocular reglado o micrómetro ocular.
Un corte transversal de tal dispositivo se muestra en la figura:
Un aspecto importante del método seguido en ante cada tipo de dispositivo que produce interferencia de dos haces coherentes por división de la superficie de onda es el establecimiento de la expresión o expresiones concretas para el cálculo de la diferencia de camino óptico de entre los rayos en función de las características ópticas y geométricas del dispositivo y luego expresar las condiciones de máximo y mínima intensidad para esa expresión concreta de la diferencia de camino óptico. En el caso particular del dispositivo de la doble rendija se tiene que las características ópticas son los índices de refracción de los medios que estén relacionados con el dispositivo. Por otra parte las características geométricas de tales dispositivos son el periodo o separación entre la doble rendija y la separación entre la doble rendija (d) y la pantalla donde se recoge el patrón (D).
De la figura se aprecia que para este dispositivo la diferencia de camino óptico entre los rayos que se superponen en un punto que tiene una posición angular q, medida desde el punto central de la pantalla y con centro en la doble abertura, y para el caso que se tenga un solo medio de índica de refracción n, viene dada por:
donde d es la separación entre las dos aberturas. Entonces se tiene las siguientes situaciones:
Diferencia de fase |
Diferencia de camino óptico |
|
Condición de máxima intensidad. |
||
Condición de mínima intensidad |
donde m es el orden o número de conteo de los máximos. Nótese que para el máximo central el orden es m = 0. Y la existencia de los valores positivos y negativos se toman para poder relacionar los máximos y mínimos a ambos lados del máximo central.
Existen otros dispositivos en los cuales se logra la interferencia de dos haces coherentes tales como: El Espejo de Lloyd, Las Espejos de Fresnel; El Biprisma de Fresnel, La Bilente de Billet, etc.
2.12.4 Interferencia en láminas delgadas
Existen otras formas de manifestarse el fenómeno de la interferencia. Entre ellas está la llamada interferencia en láminas delgadas. Este caso se produce la interferencia de los haces coherentes logrados por división de la amplitud. La amplitud de la onda se divide entre las ondas reflejadas en las dos superficies de una lámina muy delgada o entre las ondas que atraviesan la lámina y las que emergen de ellas luego de sufrir dos reflexiones en las dos superficies de la lámina y desde dentro de la lámina.
De nuevo de lo que se trata es de encontrar cómo se relaciona la diferencia de camino óptico o de fase de las características ópticas y geométricas de la lámina y de los medios que la rodean. Las características ópticas son los índices de refracción de los tres medios, a saber: n1 que es el índice de refracción del medio desde el cual incide la luz sobre la lámina; n2 que es el índice de refracción del medio de que está constituida la lámina y n3 que es el índice de refracción del medio que está situado al otro lado de la lámina y hacia el cual para la luz transmitida. Las características geométricas son el espesor de la lámina en punto dado y el ángulo que forman las dos superficies que delimitan la lámina. Para las láminas planoparalelas el espesor es constante y el ángulo citado es cero.
Veamos el caso de la interferencia que se produce al superponerse los rayos reflejados. Y por simplicidad el caso de las láminas planoparalelas. Tal situación se representa esquemáticamente en la siguiente figura:
Se pude probar que la diferencia de camino óptico, en primera aproximación, toma la expresión:
Pero ha de tomarse en cuenta que las reflexiones pueden cambiar la fase de la onda en un valor de ±p. Este cambio se produce cuando el índice de refracción del medio hacia el cual se refracta la luz es mayor que el índice de refracción del medio desde el cual la luz incide.
Por esta razón se tiene que la diferencia de camino óptico se debe expresar de forma exacta de las siguientes maneras:
Diferencia de camino óptico |
Casos |
para incidencia inclinada |
|
para incidencia normal |
|
para incidencia inclinada |
|
para incidencia normal |
A partir de estas expresiones y aplicando las condiciones de máxima y mínima intensidad luminosa. Un caso particular es el de la incidencia normal, con q igual a 0º, convierte todas estas expresiones en relaciones más sencillas.
Aunque estas expresiones para la diferencia de camino óptico fueron obtenidas para el caso de láminas planoparalelas, ellas son válidas para los casos de láminas de espesos variable.
En todos los casos las láminas han de ser muy delgadas. Esto se debe a que si el espesor es grande entonces las diferencias de camino excederán a la longitud de coherencia y se pierde la coherencia para que los rayos puedan interferir.
Es conveniente discutir cuáles son los resultados de estos fenómenos de interferencia.
Veamos algunos de los casos más importantes.
![]() | Lámina plano paralela iluminada con rayos paralelos entre sí. |
![]() | Lámina de espesor variable. |
Para las cuñas se tiene la figura que representa una vista lateral de la cuña y de la luz l los rayos que inciden sobre ella para el caso de al incidencia normal:
Figura # 18
Entonces se puede hacer:
y
restando se tiene:
Y como
se tiene
que es la ecuación que caracteriza el fenómeno de la interferencia en los casos que las láminas tengan formas de cuñas. En esta ecuación r es la densidad lineal de franjas completas en el patrón que se forma sobre la cuña y que se mide en m-1.
Para los anillos de Newton la discusión se efectuará por los estudiantes al trabajar la correspondiente situación problémica.
2.12.5 Conclusiones
Los fenómenos de la interferencia luminosa confirman la naturaleza ondulatoria electromagnética de la luz.
Las condiciones de coherencia garantizan la existencia y la visibilidad de los patrones de interferencia.
Y las condiciones de máxima y mínima intensidad que se producen en el patrón y que deben ser concretadas o particularizadas para el tipo de dispositivo interferencial del que se trate, permiten calcular las posiciones y otros detalles de ese patrón.
En el estudio de estos fenómenos deben ser tomados en cuenta los distintos aspectos que se relaciones en ellos, a saber: las características de la radiación incidente sobre el dispositivo, y entre las que encuentran la composición espectral (longitudes de onda o frecuencias) y la intensidad; las características del dispositivo, en particular las características óptico - geométricas del mismo y las características de patrón, entre las que están las posiciones angulares o lineales de los distintos detalles y la intensidad de la luz en cada punto.
Las aplicaciones tecnológicas de estos fenómenos van desde lo que se conoce como Interferometría que se refiere a las mediciones que pueden ser realizadas a partir de la interferencia, tales como las mediciones de longitudes de ondas, de pequeñas distancias y ángulos, de índices de refracción y la determinación de propiedades geométricas de distintos cuerpos; hasta las aplicaciones modernas en la holografía y la reproducción y selección de imágenes de alta resolución y con propiedades tridimensionales.
Por otra parte, en las Telecomunicaciones, en un fenómeno a tener en cuenta cuando en el empeño de la fidelidad y calidad de la información transmitida, este fenómeno puede ser perjudicial y habrá que disminuir su efecto.
2.13 Difracción de la luz
2.13.1 Introducción
Entre los fenómenos en los que se manifiesta la naturaleza ondulatoria electromagnética de la luz se encuentran los de la difracción de la luz.
La difracción es consecuencia de la superposición de las ondas secundarias emitidas por cada punto de una superficie de ondas, según sus amplitudes y fases. Este fenómeno se manifiesta en general con la violación o limitación de la denominada ley de la propagación rectilínea de la luz. También este fenómeno es capaz de producir un patrón de difracción de la luz.
Para su estudio, el fenómeno de la difracción de la luz se divide en dos tipos: la denominada difracción de Fresnel y la difracción de Fraunhofer. En el primer caso, los rayos que se superponen para producir el fenómeno no son paralelos entre sí. En tanto en el segundo caso si lo son.
En particular veremos cómo se puede estudiar la distribución de intensidades de la luz en el patrón de difracción.
2.13 1 Discusión inicial
Estas afirmaciones deben ser analizadas por Ud. para ver qué tan ciertas son en todo lo que plantean o en parte de lo que se expresa.
2.13. 2 Difracción. Difracción de la luz. Principio de Huygens-Fresnel
Estos fenómenos fueron descubiertos por Grimaldi en la segunda mitad del Siglo XVII.
El fenómeno de la difracción de la luz se manifiesta con la violación de la ley de propagación rectilínea de la luz en medios homogéneos. En su esencia está el carácter ondulatorio de la luz y se debe a que en cada punto de al región hacia donde marcha la onda viajera, la amplitud resultante de las oscilaciones del vector óptico se deben a la superposición de los aportes infinitesimales de las ondas secundarias emitidas por elementos de superficie de la superficie de onda. Esta superposición debe ser calculada tomando en cuenta, además de las amplitudes de esas contribuciones infinitesimales, las fases de esas ondas secundarias que se superponen.
Precisamente este el contenido del Principio de Huygens Fresnel. Según este principio la nueva superficie de onda es la envolvente de las ondas secundarias emitidas por cada punto de la vieja superficie de onda. (Hasta aquí se da el aspecto cualitativo de la forma de las sucesivas superficies de onda en una onda luminosa u otros tipos de ondas. Este fue el aporte de Huygens). Y la amplitud de las oscilaciones del vector óptico en un punto por delante de la superficie de onda, situado en la región hacia la que marcha la luz, será la suma de las amplitudes infinitesimales de las ondas que son las contribuciones de cada punto de frente de onda, asociada a un área infinitesimal de esa superficie de onda, y en esa suma ha de tomarse en cuenta la oblicuidad de la dirección en la que se encuentra el punto dedo con respecto a la dirección perpendicular a la superficie de onda, la distancia del foco emisor de las ondas secundarias hasta el punto donde se desea hallar la correspondiente contribución y las relaciones de fase entre esas ondas secundarias que se superponen en el punto dado. (Ahora se tienen los aspectos cuantitativos. Estos fueron los aportes de Fresnel).
Veamos como desde el punto de vista cualitativo se puede explicar la difracción de la luz en una abertura al contornear la luz los bordes que delimitan la abertura.
Supongamos que a una abertura en una pantalla opaca llega normalmente una onda plana cuyas superficies de onda son planas, entonces aplicando el principio de Huygens Fresnel se tiene:
donde se aprecian dos aspectos, a saber: la luz al pasar por las cercanías de los bordes de los obstáculos se desvía de la marcha rectilínea y la intensidad de la luz que se desvía de la marcha rectilínea es menor que la que sigue cumpliendo con la ley de la propagación rectilínea. Estos dos aspectos, en conjunto nos lleva a comprender que si los bordes de la abertura se acercan, lo que sería equivalente a que la rendija sea mucho más estrecha, la relación de la intensidad de la luz que se desvía en comparación con la que no, irá en aumento, haciendo más visible y notable el efecto de la difracción.
Así se puede llegar a establecer un criterio para que la difracción sea apreciable. Tal condición es tal que b ~ l (con b>l).
Desde el punto cuantitativo se tendría:
De acuerdo con este principio la contribución infinitesimal a la amplitud de las oscilaciones del vector óptico en el punto P debido a las ondas secundarias emitidas desde un punto de la superficie de onda asociado con el elemento infinitesimal de área DAi debe ser proporcional a esa área, al llamado factor de oblicuidad q(ai)=[1+cos(a i)]/2 e inversamente proporcional a la distancia desde el punto en la superficie de onda y el punto P.
Y al sumar (una integral) todas estas contribuciones debe tomarse en cuenta las diferencias de fase entre todas las contribuciones de todos los puntos, descubiertos, de la superficie de onda. Tal suma será entonces una suma fasioral (una integral fasioral).
2.13 3 Difracción de Fresnel y de Fraunhofer
Aunque la difracción, como fenómeno es un solo, para su estudio y atendiendo a la forma de iluminar los dispositivos y como consecuencia de ello por el grado de dificultad matemática para su estudio. Las dos formas son llamadas: difracción de Fresnel y difracción de Fraunhofer.
En el segundo caso la difracción se logra al iluminar el obstáculo con rayos paralelos entre sí y que luego los rayos difractados, que se superpondrán, que sean paralelos entre sí. Como los rayos paralelos se pueden lograr, teóricamente, por disponer la fuente de luz infinitamente alejada del dispositivo (obstáculo) y luego disponer de una pantalla donde se van a observar los resultados de la difracción (patrón de difracción) a una distancia prácticamente infinita de dispositivo (obstáculo). Como esto imposible en las condiciones del laboratorio, lo que realmente se hace es colocar una fuente puntual en el punto focal de una lente convergente L1 y hacer así que los rayos que inciden sobre el obstáculo sean paralelos entre sí. Al otro lado del obstáculo se dispone otra lente convergente L2, colocándose una pantalla en el plano focal de dicha lente para recoger los rayos que se difractan paralelamente entre sí.
El estudio de este tipo de difracción se simplifica mucho desde el punto de vista matemático, como veremos en el ejemplo de la difracción de Fraunhofer por una abertura, debido a que como las lentes delgadas no introducen diferencia de camino óptico, toda la diferencia de camino óptico entre los rayos de las ondas secundarias que llegan, con un determinado ángulo, se producirá después de atravesar la lente L2 y este no es difícil de calcular y por otro lado el factor de oblicuidad es igual para todos los rayos que se difractan con un mismo ángulo.
Para el primer caso, el de la difracción de Fresnel se tiene que en general los rayos que inciden sobre el dispositivo y obstáculo no lo hacen en forma paralela entre sí y los rayos que se han de superponer después de pasar por los puntos de la vecindad del obstáculo se han difractado con distintos ángulos. Esta es la situación más habitual de producirse la difracción de la luz.
En estos casos la descripción matemática se hace más complicada. A pesar de ello, existen determinados métodos gráficos y "algebraicos" que permiten llegar a los resultados finales de forma más expedita.
En la gráfica se representa una situación de iluminación con las condiciones para la difracción de Fraunhofer:
Y por otro lado en la siguiente gráfica se representa una situación de iluminación con las condiciones de la difracción de Fresnel:
Veamos cómo se podría estudiar la difracción de Fresnel para el caso de una abertura circular en una pantalla opaca.
Fresnel utilizó una forma muy interesante para tomar los elementos de área de la superficie de onda que a partir de una fuente puntual y que llega a la abertura circular. Sobre este sector de superficie de onda se trazan, imaginariamente, circunferencias concéntricas con centro en el punto de intersección del frente de onda con la línea que une el punto de emisión de las ondas con el punto P, por delante de la superficie de onda. Estas circunferencias tiene un radio tal que los rayos llegan a P partiendo de los puntos del frente de onda que y quedan sobre cada circunferencia tienen una diferencia de camino óptico igual a media longitud de onda con los rayos que parten de los puntos que están sobre la circunferencia contigua (en el caso que todo este fenómeno se efectúe en un medio de índice de refracción n, la diferencia de camino será l/2n). A los sectores que quedan entre dos de estas circunferencias se les llama zonas de Fresnel.
En la figura se representa la división en zonas de Fresnel:
De esta forma los rayos que parten de los puntos que están en la frontera de la zona de orden cero y la zona de orden 1 y los que están en la frontera de la zona de orden 1 la zona de orden 2 están en oposición de fase. Ellos al superponerse deben dar como resultado un mínimo de intensidad de la luz, que no es absoluto debido a que la orientación de los rayos que parten de ambas fronteras no es igual (se puede probar que el área de las zonas de Fresnel es casi la misma para todas ella).
Por otro lado los rayos que parten de las fronteras entre las zonas de Fresnel alternadas están en fase.
Esto hace que si desde el punto P se "ve" una cantidad impar de zonas en él habrá un máximo y si el número de zonas que se "ven" desde P es par, entonces habrá en P un mínimo de intensidad luminosa.
Al ir alejando el punto P se desnudará en abertura circular una cantidad de zonas de Fresnel que será cada vez mayor por lo que se tendrá una sucesión de máximos y mínimos de intensidad.
También si el diámetro de la abertura circular en la pantalla opaca se aumenta, sin mover el punto P, entonces en P se producirá una sucesión de máximos y mínimos de intensidad.
Es muy interesante el caso en que la abertura en la pantalla opaca no sea circular, sino de bordes irregulares y queda a los estudiantes investigar lo que ocurre en ese caso.
Se pueden ejecutar dos procedimientos para calcular la amplitud de las oscilaciones del vector óptico en el punto P, a saber: un método de suma fasorial gráfica y un método algebraico. En ambos casos queda a los estudiantes investigar cómo se procede y cuáles serán los resultados. Por ejemplo se tiene el resultado sorprendente que establece que cuando se coloca una pantalla opaca que tiene una abertura ante una fuente puntual de luz y de forma tal que se desnude solo la zona de Fresnel de orden cero, la intensidad de la luz que no llega es mayor que la apreciamos si no colocamos pantalla alguna.
2.13.4 Difracción de Fraunhofer por una abertura plana rectangular
Para los casos en que se observa la difracción con las condiciones de Fraunhofer se tiene una caso típico y es que se obtiene cuando se hacen incidir rayos paralelos entre sí sobre una pantalla opaca con una abertura en forma de ranura rectangular de dimensiones a y b, tal que a<<b.
En este caso la figura da una representación de la sección transversal de tal dispositivo
La contribución a la amplitud de E en punto correspondiente en la pantalla, sustentado por un ángulo q, de un elemento infinitesimal de área adx situado en el origen de un eje coordenado centrado en el centro de la abertura tomando en cuenta su dimensión b, será:
Y para el rayo que sale con ese mismo ángulo del elemento de área adx situado a una distancia x del origen del eje coordenado la contribución será:
De modo que para hallar la contribución sumaria se debe realizar la integral:
donde a=(bksenq)/2 es la diferencia de fase entre el rayo que se difracta con un ángulo q desde el punto central de la abertura y el rayo que se difracta con ese mismo ángulo desde uno de los bordes de la abertura.
Como la intensidad es proporcional al cuadrado de la amplitud de las oscilaciones del vector óptico, se tiene:
siendo I0 la intensidad el punto con q = 0 (a = 0), que es el centro del patrón de difracción que se forma en la correspondiente pantalla y es cuando la diferencia de fase de todos los rayos que llegan ese punto es nula. Nótese que I0 es proporcional al área total de al rendija.
Además, al factor que aparece multiplicando a I0 se le llama factor de difracción de Fraunhofer por una abertura rectangular.
En la figura se muestra una gráfica del factor de difracción de Fraunhofer por una abertura rectangular vs. el valor de a. Esta será la forma en que se distribuye la intensidad luminosa en el patrón correspondiente.
Es importante calcular los valores relativos de las intensidades de los máximos de intensidad.
Veamos ahora dónde es que se encuentran los distintos detalles del patrón.
Si tomamos el factor de difracción y le aplicamos el método del Cálculo Diferencial se tiene:
![]() | Los máximos se obtendrán en los puntos de la pantalla que satisfacen las condiciones:![]() |
![]() | Los mínimos se obtienen en los puntos de la pantalla que satisfacen las condiciones:![]() |
Como se aprecia, los máximos laterales no están dispuestos justo al medio entre los dos mínimos que lo delimitan, sino algo más hacia el centro del patrón con respecto esa posición intermedia.
2.13.5 Conclusiones
Entre los fenómenos de la interferencia y la difracción de la luz existen ciertas analogías y a la vez, diferencias importantes que hacen que se trate de dos tipos de fenómenos que se distinguen entre sí.
En el caso de la difracción, aunque también se trata de superposición de ondas se puede decir que las ondas que se superponen tienen una aportación infinitesimal a el resultado finan en el patrón de difracción.
Por otro lado el propio fenómeno de la interferencia, en la gran mayoría de dispositivos, se hace posible, en cuanto a lo obtención de los rayos coherentes que van a superponerse para interferir, gracias a la difracción de la luz.
La difracción de luz debe ser tomada en cuanta en el diseño de los instrumentos ópticos pues ella, al estar presente en mayor o menor medida, hace que, al apartase los rayos del cumplimiento de la ley de la marcha rectilínea de la luz, el poder separador de los instrumentos ópticos se vea afectado ya que en el campo imagen le corresponde un disco, acompañado además de anillos claro oscuros, a lo que en campo objeto era un punto. Y este afecto se aumenta al disminuir el radio de la pupila de esos instrumentos, disminución que se procura en general para aumentar la paraxialidad de los rayos y con ello evitar las aberraciones que afectan por otro lado la calidad de las imágenes obtenidas.
Para las ondas de longitudes largas utilizadas comúnmente en las comunicaciones, la difracción se produce en obstáculos de dimensiones del orden de las longitudes de onda utilizadas puede en general afectar las transmisiones. Una vía es el actual proceso en que cada vez más se trabajan en las zonas cuasi-ópticas del espectro electromagnético.
2.14 Redes de difracción
2.14 1 Introducción
Los fenómenos de la interferencia y la difracción luminosa presentan como elemento común el hecho de que ambos se producen por superposición de ondas. Por otra parte en un mismo dispositivo lo más general es que ambos fenómenos se produzcan a la vez. Así, por ejemplo en el dispositivo de la doble abertura, gracias al fenómeno de la difracción es que se puede lograr, con la primera rendija practicada en una pantalla opaca, la coherencia y por otra parte ya en el dispositivo mismo, en la doble abertura gracias a que los rayos de la luz se difractan, es que luego pueden interferir y producir el patrón de difracción.
En lo que sigue vamos a estudiar un dispositivo en el cual se produce el fenómeno de la interferencia, pero entre más de dos rayos, es decir, la denominada interferencia múltiple y en conjunción con esto, la presencia del fenómeno de difracción de la luz. Tales dispositivos son las llamadas redes de difracción.
2.14.1 Discusión inicial
Estas afirmaciones deben ser analizadas por Ud. para ver qué tan ciertas son en todo lo que plantean o en parte de lo que se expresa.
2.14.2 Difracción de Fraunhofer e interferencia múltiple por N aberturas planas rectangulares
Antes de avanzar en este tema debemos aclarar porqué estas redes se llaman planas y unidimensionales. Son planas porque se disponen las rendijas sobre una pantalla plana y son unidimensionales porque lo que se repite, las rendijas dispuestas a distancia fija, lo hace a lo largo de una sola dimensión.
Es evidente que al iluminar con las condiciones de Fraunhofer una red de difracción plana unidimensional de N aberturas iluminadas se produce el fenómeno de la difracción en cada una de estas aberturas. Aunque la posición de los respectivos centros de estos patrones es algo distinta, esta pequeña diferencia será siempre mucho menor que el ancho medio del máximo central de difracción correspondiente a cada rendija. Por esto se habla de un solo patrón. Esto significa que la distribución de la intensidad de la luz debe estar afectada por este fenómeno y que la función que describiera esta distribución debe tener como un producto del factor de difracción (sena/a)2.
Por otro lado está presente el fenómeno de la interferencia múltiple de los N rayos coherentes que emerge, cada uno, de cada rendija.
Realicemos la suma fasorial de estas N ondas coherentes.
La función de onda de la onda que emerge de la primera abertura iluminada puede ser representada de la forma siguiente:
donde j es la raíz de menos uno.
Para la onda que emerge de la rendija i se puede escribir como:
donde se ha supuesto, por comodidad que la fase inicial de todas las ondas es la misma.
Entonces la resultante se obtiene sumando estas ondas desde i = 1 hasta i = N:
donde se ha supuesto que las amplitudes de todas las ondas, son iguales.
En esta expresión b es la mitad de la diferencia de fase entre los rayos que emergen de rendijas contiguas.
Como la intensidad es proporcional a la amplitud de estas oscilaciones resultado de la superposición de las N ondas en el punto de la pantalla que tiene la posición angular q, la intensidad del patrón de interferencia múltiple será:
siendo el factor que está multiplicando a CI0 el llamado coeficiente de interferencia múltiple de N haces coherentes.
Estudiemos este factor.
En el límite cuando b tienda a cero este factor toma el valor N2. Por esta razón para que I0 sea la intensidad en el punto central del patrón de interferencia, C toma el valor del inverso de N2.
Por otra parte para los valores notables para b = ± mip, con mi = 0; 1; 2; 3; ..., se tiene que el factor de interferencia múltiple de N haces coherentes es N2.
Estos son los llamados máximos principales de interferencia múltiple de N haces coherentes o picos de interferencia.
Se puede establecer, aplicando las técnicas de estudio de extremos de funciones del Cálculo Diferencial, que la condición de mínimo de intensidad es:
Nndsenq = ± m'il, con m'i = 1; 2; 3; ...; N 1; N+1; N+2; N+3; ...; 2N1; 2N+1; ...
De esta ecuación se aprecia que existirán N1 mínimos de intensidad entre dos máximos principales adyacentes.
Es evidente que existirán, por tanto, N2 máximos secundarios entre dos máximos principales contiguos. Aunque esto puede ser probado utilizando el método que se indica más arriba.
En la figura se representa el patrón de interferencia múltiple para 10 haces coherentes.
2.14.3 Patrón de la red de difracción
Sin embargo como en la red también se produce el fenómeno de la difracción por las N rendijas iluminadas, la expresión matemática que describe cómo se distribuye la intensidad luminosa en la pantalla viene dada por:
con
donde d y b son el periodo de la red y el ancho de las aberturas respectivamente, l es la longitud de la onda incidente y q es la posición angular del detalle del patrón de que se trate.
De esta forma si se representara gráficamente el patrón se obtendría una gráfica con la forma siguiente:
Esta figura se corresponde con la red de N = 10. Además en ella se tiene una relación de d = 3b. Nótese como los máximos principales de orden 3 (3); 6 (6) y 9 (9) no aparecen. A esto se le denomina condición de coincidencia espacial de mínimos de difracción con máximos principales de interferencia. Queda a los alumnos encontrar cómo se determina esa relación.
Algunos plantean que el patrón de difracción "modula" al patrón de interferencia múltiple de N haces coherentes. Pero se puede hablar tal vez en términos de que ambos patrones se regulan uno al otro.
Otro asunto de interés es estudiar los factores de los que depende I0, que es la intensidad del máximo central. El valor de esta magnitud es proporcional a N2b2.
2.14.4 Dispersión angular y poder separador de la red
Dos interesantes magnitudes para caracterizar el comportamiento de la red como dispositivo para ser usado como espectrómetro son: la dispersión angular y el poder separador.
Veamos como se definen.
La dispersión angular es la separación angular por unidad de longitud de onda y alrededor de una longitud de onda dada de dos picos o máximos principales de longitudes de onda muy próximas, esto es:
En el SI la dispersión angular se mide en rad/m.
Se pueden obtener las expresiones de cálculo para estas magnitudes y a la vez con eso probar que la dispersión angular es función de la longitud de onda y con ello su valor no permanece constante al variar la posición angular en el patrón los picos correspondientes a un orden dado.
La obtención es como sigue: diferenciando la condición de máximo principal de interferencia se tiene:
que implica que
La segunda de estas expresiones permite establecer que la dispersión angular es función de la longitud de onda que al aumentar la longitud de onda, lo que es equivalente a que calcular la dispersión angular en una zona del patrón de mayor posición angular, la dispersión angular aumenta. Por lo demás todas estas expresiones son equivalentes y su utilización dependerá de los datos de los que se dispone.
El poder separador de una red es una magnitud adimensional que mide la capacidad de la red para hacer distinguible los picos de un mismo orden correspondientes a dos longitudes de onda con valores muy próximos. En este caso se distinguen dos valores para el poder separador:
![]() | El poder separador necesario para separar los picos correspondientes a los
valores muy próximos de longitudes de onda l1 y l2. Este valor viene dado por la expresión: |
Siendo lmax el mayor valor entre los dos valores de las longitudes de onda de los haces que se pretenden separar.
![]() | El otro valor el poder separado que aporta la red el cual se pude calcular a partir del llamado Criterio de Rayleigh. Este criterio establece que el ojo humano al observar dos detalles luminosos cualesquiera muy cercanos integra los perfiles de las distribuciones de intensidad luminosa de modo que lo que aprecia es la envolvente de la suma de ambas intensidades en cada punto de la proximidad de ambos detalles luminosos. Entonces cuando la envolvente es en la zona intermedia entre ambos detalles de tal forma que la intensidad en esos puntos sea igual o menor al 80% de la intensidad máxima que debe lograrse exactamente sobre alguno de los dos detalles, el ojo humano (y otros aparatos que miden la intensidad de la luz) puede determinar que se trata de dos detalles y no apreciarlo como uno solo. Para el caso de los picos o máximos principales de interferencia múltiple en una red de difracción este criterio implica, y esto se puede demostrar a partir de la ecuación que describe la distribución intensidad de la luz en el patrón, que la el pico de una de las dos longitudes de onda coincida espacialmente (que tenga la misma posición angular) que el primer mínimo adyacente del otro pico correspondiente a la otra longitud de onda. |
De esta forma se tiene:
que es la condición para el primer mínimo adyacente, hacia el lado en que las posiciones angulares crecen, al pico de orden m1 correspondiente a las ondas de longitud l1.
Además se tiene:
que es la condición de máximo principal de interferencia múltiple de orden mi correspondiente a la longitud de onda l2.
Nótese que para ambos se ha considerado que la posición angular es la misma. de esto se llega a:
Para garantizar que la red aporta el poder separador igual o superior al necesario es mejor calcular para el mayor de los valores de las longitudes de onda involucradas.
De esta forma sí el poder separador de la red es inferior al necesario para separar dos picos de un mismo orden correspondientes a dos longitudes de onda muy próximas en valor, estos picos no serán resueltos y se apreciarán como un solo pico en el patrón de la red. En caso contrario, cuando el poder separador que aporta la red es mayor que el necesario, los picos quedan resueltos y se aprecian claramente como dos picos. En el caso en que el poder separador de la red coincida con el necesario los dos picos se aprecian justamente como dos y se dice que están justamente resueltos.
Nótese que el poder separador que aporta la red aumenta si se aumentan el número de rendijas iluminadas o el orden en el que se trabaja. Esta segunda vía como una forma de aumentar el poder separador de la red tropieza con el hecho dado por que el patrón de difracción hace que en los órdenes superiores la intensidad sea tan baja que estos picos resultan invisibles. Entonces la búsqueda del aumento del poder separador que aporta la red debe estar en aumentar el número de rendijas iluminadas. Pero como para cumplir las condiciones de Fraunhofer es conveniente no aumentar el diámetro del haz de luz que incide sobre la red, la mejor vía de hacer esto es aumentando la densidad lineal de aberturas o ranuras en la red. Esto implica lograr redes de periodo muy pequeño.
Esto se explica si se toma en cuenta que al aumentar el número N de rendijas iluminadas las posiciones angulares de los picos no se modifican, pero la cantidad de mínimos entre máximos principales contiguos aumenta y por otro lado la intensidad de cada pico aumenta (con N2) y estos dos efectos hacen que los picos se hagan más estrechos y brillantes, esto es, se hacen más nítidos.
Pero ¿cuáles son las diferencias entre estos dos conceptos o parámetros: la dispersión angular y el poder separador?
En primer lugar se trata de magnitudes definidas de distinta forma, siendo la dispersión angular una magnitud con dimensiones inversas a la de la longitud de onda y el poder separador es adimensional.
En segundo lugar la dispersión angular depende de la longitud de onda y el poder separador que aporta la red no depende de la longitud de onda.
Por último, y lo principal, la dispersión angular está relacionada con la distancia angular entre dos picos correspondientes a dos longitudes de onda muy próximas y no con el perfil de los picos, en tanto el poder separador que da la red esta relacionado con el perfil de los picos y con la capacidad de distinguir uno del otro. De este modo se pueden tener tres redes A, B y C tales que A tenga igual dispersión angular que B y menor dispersión angular que C y a la vez que B tenga mayor poder separador que A e igual poder separador que C. Se insta a los estudiantes a construir las gráficas de las representaciones de una parte de los patrones de interferencia de tales redes.
Está claro que sería bueno disponer de una red que tuviera una gran dispersión angular en la zona de interés del espectro y un gran poder separador ya desde el primer orden. Esto se logra teniendo una red que tenga una gran densidad lineal de rendijas, esto es que r sea grande.
2.14 5 Conclusiones
Las redes de difracción, gracias al aumento que se puede lograr del poder separador aún desde el mismo primer orden mediante el aumento del número de rendijas iluminadas y a la alta dispersión que se puede lograr por la vía de disminuir el periodo de la red, todo lo que se puede lograr a la vez mediante el procedimiento de aumentar la densidad lineal del rayado de la red, se constituyen en aparatos espectrales por excelencia, tanto en redes de fases (o sus copias) o con redes por reflexión.
Por otro lado el estudio de la simple red plana con el rayado en una sola dimensión aporta los métodos de estudio de otros casos más complejos y muy interesantes como los cristales que para las radiaciones de los Rayos X y para las ondas asociadas a haces de electrones de electrones se constituyen en redes tridimensionales que al ser "iluminadas" con estas radiaciones permiten la formación de patrones de líneas curvas, para el caso de los policristales, y de patrones de puntos, para el caso de los monocristales.
Así la Difracción de los Rayos X y la Electronografía conforman dos de los más poderosos métodos para la investigación científica y la evaluación de los cristales, sus propiedades estructurales y su comportamiento.
2.15 Relación de situaciones problémicas