La parte importante de esta historia no es que una red neuronal haya aprendido física. Esa frase suena bien, vende mejor y confunde casi todo. Lo relevante es más sobrio y bastante más poderoso: investigadores de la Universidad Tecnológica de Chalmers, en Suecia, diseñaron un sistema capaz de incorporar leyes físicas antes del entrenamiento, de modo que el modelo no tenga que descubrir desde cero cómo se comporta la luz cada vez que analiza un nuevo componente óptico.
En ciencia aplicada, esa diferencia no es un matiz. Es la frontera entre una herramienta vistosa y una herramienta útil. Durante años, buena parte del entusiasmo alrededor del aprendizaje automático se apoyó en una promesa simple: si se alimenta un modelo con suficientes datos, terminará encontrando patrones que escapan al ojo humano. El problema es que, en física, “suficientes datos” puede significar semanas de simulaciones, supercomputadoras trabajando sin pausa y miles de resultados intermedios que cuestan demasiado para ser tratados como combustible barato.
El grupo dirigido por Philippe Tassin, profesor del Departamento de Física y Astronomía de Chalmers, trabaja en nanofotónica, un territorio donde la luz deja de comportarse con la familiaridad de una lámpara o una lente común. Cuando interactúa con estructuras más pequeñas que su propia longitud de onda, aparecen fenómenos que permiten manipularla con una precisión extraordinaria. Allí nacen las promesas de lentes más delgadas, cámaras más eficientes, cristales fotónicos para comunicaciones avanzadas y posibles piezas auxiliares para futuras arquitecturas cuánticas.
Pero el laboratorio no puede fabricar a ciegas cada geometría posible. La exploración ocurre, en buena medida, dentro de simulaciones. Se propone una estructura, se calcula cómo dispersa, refleja, transmite o absorbe la luz, se ajusta el diseño, se vuelve a probar. Esa coreografía computacional es lenta. Según Chalmers, generar un solo punto de datos puede requerir entre diez minutos y una hora, y entrenar una red puede demandar hasta 40.000 simulaciones. Traducido sin maquillaje: un mes de cómputo puede evaporarse antes de que el investigador tenga una herramienta razonable para empezar a diseñar.
El hallazgo central: la red no fue entrenada como una caja negra pura. El equipo incorporó conocimiento físico sobre dispersión electromagnética, modos cuasinormales, conservación de energía y causalidad. Con esa arquitectura, el modelo necesitó muchos menos datos y evitó errores obvios que las redes convencionales pueden producir cuando aprenden solo por correlación.
La forma correcta de enseñar una máquina
El trabajo publicado por Viktor A. Lilja, Albin J. Svärdsby, Timo Gahlmann y Philippe Tassin en Laser & Photonics Reviews propone un marco general para integrar conocimiento en modelos de aprendizaje automático aplicados a dispersión electromagnética. El nombre técnico, “expansión de modos cuasinormales de la matriz de dispersión”, puede sonar como una verja de hierro para el lector no especializado. Conviene atravesarla sin dramatismo.
La matriz de dispersión es una forma matemática de describir qué ocurre cuando una onda electromagnética llega a un objeto: qué parte entra, qué parte sale, qué parte se refleja, qué parte se transmite. Los modos cuasinormales, por su parte, capturan resonancias propias del sistema, es decir, las maneras características en que una estructura puede almacenar y perder energía. La jugada de Chalmers consistió en no pedirle a la red neuronal que produzca directamente toda la respuesta óptica como si fuera una adivina numérica. En cambio, la entrenaron para estimar parámetros vinculados con esos modos físicos, y luego usaron esa estructura para reconstruir la respuesta completa.
La distinción importa porque reduce el espacio del disparate. Una red común puede acertar mucho dentro de los casos que vio durante el entrenamiento y fallar con elegancia matemática apenas se la empuja fuera de su zona cómoda. En campos donde se diseñan objetos físicos, ese tipo de falla no es una curiosidad académica. Puede significar semanas perdidas, prototipos inútiles o resultados que parecen plausibles en pantalla pero no obedecen las restricciones del mundo real.
La inteligencia del método no está en reemplazar la teoría por cómputo, sino en obligar al cómputo a caminar dentro de la teoría. Esta es una corrección necesaria al culto de la escala. Más datos no siempre significan más comprensión. A veces significan que el sistema está desperdiciando recursos para redescubrir la conservación de energía, la causalidad o las relaciones que el electromagnetismo ya dejó escritas.
La red no se volvió mejor porque “pensara” como una científica. Se volvió mejor porque recibió una arquitectura que le impedía ignorar la física básica. Ese es el punto serio del avance.
La tradición de redes informadas por física no nació ayer. Investigadores como Maziar Raissi, Paris Perdikaris y George Em Karniadakis impulsaron hace años el uso de redes neuronales entrenadas para respetar ecuaciones diferenciales y condiciones físicas. El campo creció porque responde a una tensión real: la ciencia muchas veces tiene poca información experimental, mucha teoría acumulada y problemas inversos difíciles, aquellos en los que se conoce el efecto deseado pero no el diseño que lo produce.
El aporte de Chalmers se ubica dentro de esa corriente, pero con una pieza específica: la dispersión electromagnética en dispositivos ópticos y fotónicos. No es una receta universal para todo problema científico, y sería irresponsable venderla como tal. Su fortaleza está en un dominio donde las ecuaciones son duras, los cálculos son caros y los errores de las redes negras tienen consecuencias técnicas claras.
El cuello de botella era probar demasiado
La promesa más concreta del trabajo no está en la frase “aprendió las leyes de la física”, sino en una proporción brutal: lo que antes podía tomar treinta días de generación de datos ahora puede resolverse, según el equipo, en unos tres. En el caso de losas de cristal fotónico, Optics & Photonics News reportó que QNM-Net alcanzó una precisión espectral comparable con apenas una décima parte de los datos requeridos por redes completamente conectadas convencionales. En metasuperficies dieléctricas de forma libre, más complejas y con un espacio de diseño mucho mayor, la reducción fue cercana a un factor de tres.
Ese contraste revela algo importante. El método no borra la dificultad. La desplaza. Cuando el problema está bien estructurado y las resonancias pueden representarse con suficiente economía, la ventaja es enorme. Cuando la geometría se vuelve más libre, la red informada por física sigue ayudando, pero ya no hace magia. Incluso el propio reporte especializado advierte que, en algunos casos, el sistema no reprodujo resonancias simuladas con la precisión deseada. Esa limitación no debilita el trabajo; lo vuelve creíble. La ingeniería real avanza así, no como tráiler de película.
El ahorro de datos tiene una consecuencia más profunda que la simple velocidad. Cambia el tipo de preguntas que un laboratorio puede permitirse. Si cada corrección de rumbo cuesta otro mes, los investigadores tienden a volverse conservadores. Exploran menos, prueban variantes menos arriesgadas y toleran diseños subóptimos porque el calendario también manda. Cuando el costo cae de forma significativa, el proceso se vuelve más parecido a una conversación técnica: se prueba, se descarta, se refina, se vuelve a mirar.
En ese sentido, el avance no automatiza la invención. Automatiza parte de la paciencia. Y eso, en materiales avanzados, puede valer mucho más que una promesa abstracta de creatividad artificial. La innovación rara vez aparece como un relámpago aislado. Suele depender de la cantidad de iteraciones inteligentes que un equipo puede financiar antes de quedarse sin tiempo, sin presupuesto o sin energía mental.
Qué cambia en la práctica
Menos simulaciones inútiles: al conocer restricciones físicas desde el inicio, la red necesita menos ejemplos para aproximar el comportamiento óptico de una estructura.
Más control sobre el error: el modelo queda atado a principios como conservación de energía y causalidad, lo que reduce respuestas físicamente absurdas.
Diseño más rápido: una vez entrenada, la red puede estimar propiedades ópticas en escalas de milisegundos, lo que acelera la búsqueda de geometrías útiles.
La palabra “garantía” debe leerse con cuidado. El paper sostiene que el marco asegura ciertas propiedades físicas dentro de su formulación, no que cualquier dispositivo diseñado con el sistema vaya a funcionar perfectamente al fabricarse. Entre una simulación y un objeto real hay tolerancias de manufactura, ruido, imperfecciones, materiales que no se comportan como el modelo y una lista de pequeñas traiciones que todo laboratorio conoce. La simulación informa; no absuelve.
Por qué importa para la luz y para la computación cuántica
La aplicación más fácil de visualizar está en lentes. No porque sea la más espectacular, sino porque cualquiera entiende el valor de una óptica más delgada y eficiente. Cámaras, anteojos, sensores, microscopios y sistemas de imagen dependen de componentes capaces de controlar la luz con precisión. Las metasuperficies y los materiales artificiales buscan hacer con estructuras nanométricas lo que antes requería piezas voluminosas. Menos vidrio, más geometría. Menos masa, más diseño.
El vínculo con la computación cuántica es más delicado y conviene no inflarlo. El trabajo no resuelve la construcción de computadoras cuánticas tolerantes a fallos ni elimina los desafíos de escalar qubits. Lo que sí puede aportar es una herramienta para diseñar componentes fotónicos capaces de guiar, reflejar o transmitir luz en sistemas donde la información necesita moverse con pérdidas mínimas. Chalmers conecta esta línea con investigaciones sobre cristales fotónicos mecánicamente compatibles y comunicación óptica entre computadoras cuánticas o a mayores distancias.
La diferencia entre esa afirmación y el titular fácil es enorme. No se trata de que una red vaya a acelerar por sí sola “el gran salto cuántico”. Se trata de que, si las tecnologías cuánticas necesitan una infraestructura óptica cada vez más refinada, cualquier método que acorte el ciclo de diseño de esos componentes gana relevancia estratégica. La ventaja no está en el show, sino en el taller.
Suecia entiende bien ese tipo de paciencia. El Wallenberg Centre for Quantum Technology, coordinado desde Chalmers, trabaja desde 2018 en un programa nacional de largo plazo para desarrollar capacidades cuánticas, incluido un computador de 100 qubits como objetivo. En ese mapa, la investigación de Tassin y su grupo no es una pieza aislada ni un anuncio de consumo masivo. Es parte de una infraestructura científica donde materiales, fotónica, simulación y hardware empiezan a tocarse.
Hay una lección más amplia para leer entre líneas. La etapa más interesante del aprendizaje automático científico quizá no sea aquella en la que los modelos crecen hasta tragarse todos los datos disponibles, sino aquella en la que se vuelven más disciplinados. Menos brutos. Más conscientes de lo que no pueden violar. En áreas donde la realidad impone restricciones severas, una máquina que sabe menos pero respeta mejor puede ser más valiosa que otra inmensa, opaca y hambrienta.
El límite que no conviene ignorar
El método brilla cuando existe conocimiento físico sólido que puede incorporarse al modelo. Allí está su fuerza y también su frontera. No sirve como excusa para aplicar aprendizaje automático a cualquier problema con la esperanza de que la matemática ordene el caos. Funciona porque el electromagnetismo ofrece leyes claras, porque la dispersión puede representarse con herramientas maduras y porque los investigadores supieron insertar teoría donde otros solo habrían agregado datos.
Ese es el juicio más razonable sobre el avance: no es una revolución general de la inteligencia computacional, sino una mejora seria en el modo de usar redes neuronales para problemas físicos costosos. Puede parecer menos espectacular. También es más importante. La ciencia no necesita máquinas que finjan intuición humana para impresionar a una audiencia; necesita instrumentos que reduzcan el desperdicio, respeten las restricciones del mundo y permitan probar mejores diseños antes de que el presupuesto se evapore.
La física, en esta historia, no fue desplazada. Volvió a ocupar el asiento del conductor. La máquina hizo lo que mejor sabe hacer: calcular rápido, explorar combinaciones, detectar relaciones difíciles de ver. Pero lo hizo con una condición previa, no negociable: obedecer las reglas del juego. Tal vez esa sea una imagen más sobria del futuro tecnológico, y por eso mismo más convincente. No sistemas que reemplazan el conocimiento acumulado, sino herramientas que se vuelven útiles cuando dejan de comportarse como si pudieran ignorarlo.
Referencias
Chalmers University of Technology. “Physics-trained digital ‘super-brain’ speeds up technology development”. Publicado el 4 de junio de 2026. Fuente
Viktor A. Lilja, Albin J. Svärdsby, Timo Gahlmann y Philippe Tassin. “A General Framework for Knowledge Integration in Machine Learning for Electromagnetic Scattering Using Quasinormal Modes”. Laser & Photonics Reviews, 2026. DOI: 10.1002/lpor.202502769. Fuente
arXiv:2509.06130. “A general framework for knowledge integration in machine learning for electromagnetic scattering using quasinormal modes”. Versión revisada el 13 de abril de 2026. Fuente
Optics & Photonics News. Edwin Cartlidge. “A Little Physics Improves AI Optical Design”. Publicado el 15 de junio de 2026. Fuente
George Em Karniadakis, Ioannis G. Kevrekidis, Lu Lu, Paris Perdikaris, Sifan Wang y Liu Yang. “Physics-informed machine learning”. Nature Reviews Physics, 2021. Fuente
Maziar Raissi, Paris Perdikaris y George Em Karniadakis. “Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations”. Journal of Computational Physics, 2019. Fuente
Wallenberg Centre for Quantum Technology, Chalmers University of Technology. Programa nacional sueco de tecnologías cuánticas. Fuente



