Cómo Zyphra entrenó un modelo con datos de EEG a escala

El modelo abierto que completa las señales del cerebro

ZUNA, liberado por la startup Zyphra, ataca un problema prosaico que traba a clínicas y laboratorios: canales que se pierden, ruido que invade, registros que terminan en la basura. Su aporte inmediato no es “leer la mente”, sino reconstruir electroencefalografía con un autoencoder de difusión y coordenadas de electrodos, para que la señal deje de depender del cable perfecto.

Por la redacción | 19 de febrero, 2026

El monitor del laboratorio de sueño marca la medianoche. En la pantalla, las ondas deberían fluir como una partitura lenta: ritmos, microdespertares, transiciones. Pero aparece un corte, después otro. Un electrodo se despega, un cable se mueve, el registro se llena de ruido. En un hospital, ese tipo de falla no es un drama cinematográfico, es el pan de cada guardia. La electroencefalografía es barata, ubicua y, cuando funciona, invaluable. También es frágil.

La rutina para “reparar” esas señales suele parecer artesanía estadística. Se descartan segmentos, se etiquetan canales defectuosos, se interpolan puntos perdidos. En MNE, una de las bibliotecas de referencia en neurociencia computacional, el método por defecto para recomponer canales de EEG recurre a la interpolación por splines esféricos, que proyecta sensores sobre una esfera y estima la actividad ausente a partir de los canales vecinos. Es rápido, razonable cuando falta poco, y engañoso cuando el vacío crece. Cuando el registro pierde densidad, el algoritmo puede terminar inventando una calma que el cerebro nunca tuvo.

En ese hueco entra ZUNA, el modelo abierto que Zyphra liberó con licencia Apache 2.0 y pesos disponibles públicamente. La promesa, bien leída, no es la telepatía. El aporte inmediato es menos glamoroso y más útil: limpiar, reconstruir y ampliar señales de EEG con un sistema entrenado para sobrevivir a la degradación que arruina tantos experimentos, diagnósticos y prototipos de interfaces cerebro computadora.

Cuando el electrodo falla, el dato miente

La electroencefalografía vive una paradoja. Es una de las ventanas más extendidas hacia la actividad cerebral, desde salas de epilepsia hasta estudios de sueño, desde laboratorios universitarios hasta cascos de consumo con ambición de medir atención. Sin embargo, su señal atraviesa un filtro biológico difícil: piel, cráneo, músculo. Esa travesía atenúa y mezcla fuentes. A la física se le suma la logística: gel que se seca, pestañeos que dominan el espectro, movimientos que contaminan segundos enteros.

Una neurofisióloga que supervisa estudios nocturnos en un hospital público, y que pidió reserva por no hablar en nombre de la institución, describe una escena repetida: “En un mismo registro se puede perder más de la mitad de los canales por artefactos o desprendimientos. Si se descarta todo, no queda muestra. Si se rellena sin cuidado, el análisis se vuelve una ficción”. Su comentario no es una denuncia, es un recordatorio de cómo se construye evidencia cuando el hardware no perdona.

El parche clásico ha sido geométrico. La documentación de MNE explica que la interpolación de canales de EEG se hace con el método de spline esférico, y que su mecánica consiste en proyectar las ubicaciones a una esfera y estimar la señal en sensores “malos” a partir de los “buenos”. En pérdidas pequeñas, el resultado puede ser competente. El problema aparece cuando los huecos se multiplican, porque el suavizado deja de ser reparación y empieza a ser maquillaje.

El desafío no es solo clínico. Los datos de EEG están fragmentados, dispersos en repositorios públicos con protocolos distintos, filtros diferentes y convenciones incompatibles. Ese mosaico ha frenado la construcción de modelos generales, incluso cuando el campo ya experimenta con preentrenamientos auto supervisados, como Neuro-GPT, y con revisiones recientes que señalan una traba persistente: la falta de comparaciones justas por diferencias de preprocesamiento y evaluación.

La apuesta de Zyphra apunta a infraestructura. En vez de vender un clasificador final, propone un prior aprendido sobre señales de EEG para reconstruir lo ausente. Es un tipo de avance que rara vez suena épico, pero cambia el suelo: si se rescatan sesiones que antes se descartaban, el progreso deja de depender de conseguir más noches de grabación o más sujetos, algo especialmente relevante cuando los estudios se hacen con presupuesto de laboratorio y paciencia humana.

El modelo que aprendió a rellenar lo que falta

ZUNA se presenta como un autoencoder de difusión con columna vertebral de transformador. La lógica es entrenar una red para revertir corrupciones deliberadas: se enmascaran partes de la señal, se aplican esquemas de dropout agresivos y se obliga al sistema a reconstruir el registro completo. Con suficiente diversidad, la red deja de parecer un interpolador elegante y se convierte en una máquina de relleno que internaliza regularidades del EEG más allá de la vecindad espacial.

El blog técnico de Zyphra describe el flujo central: un codificador que mapea señales a un espacio latente compartido y un decodificador que reconstruye desde esos latentes. El entrenamiento combina pérdida de reconstrucción enmascarada y degradación intensa para que la inferencia aguante los peores días del laboratorio. La salida práctica es triple: limpiar canales existentes, recuperar canales perdidos y predecir canales nuevos cuando se le entregan coordenadas físicas en el cuero cabelludo.

Ese último punto obliga a abandonar una suposición implícita de muchos pipelines: que el EEG siempre llega con el mismo número de electrodos y el mismo montaje. Zyphra detalla dos innovaciones para atacar la heterogeneidad. La primera comprime cada canal en “chunks” de 0,125 segundos, que el modelo aprende a mapear a tokens continuos, y luego rasteriza esos tokens en una secuencia unidimensional apta para un transformador. La segunda usa Rotary Position Embeddings en cuatro dimensiones, codificando x, y, z del electrodo junto a una dimensión temporal gruesa, para generalizar a posiciones nuevas sin perder orden temporal.

El tamaño busca caber. Con 380 millones de parámetros, el modelo se ubica en un rango que permite correr inferencias en una GPU de consumo y, en ciertos flujos, incluso en CPU, según la ficha del modelo y el repositorio. El entrenamiento, en cambio, tuvo apetito: Zyphra afirma haber curado alrededor de dos millones de “channel-hours” de EEG a partir de múltiples fuentes públicas, con un pipeline estandarizado.

La evidencia pública pone el foco donde los métodos clásicos se estiran hasta romperse. En la comparación contra la interpolación por spline esférico, ZUNA mantiene un error relativamente estable mientras la línea de base se dispara cuando el dropout sube hacia 0,90 y 0,95. El gráfico publicado en la ficha de Hugging Face muestra curvas separándose en un set de validación y en conjuntos como ANPHY-Sleep, Berlin BCI, BCI2000 y AAD.

Valores aproximados leídos del gráfico público de desempeño divulgado por Zyphra y replicados aquí para comparación visual.

La métrica usada en ese gráfico es NMSE, un error normalizado que crece cuando la reconstrucción se aleja del registro original. El interés no está en el número absoluto, que depende de cómo se escala la señal, sino en la pendiente: cuando el porcentaje de canales ausentes supera tres cuartos del montaje, la reconstrucción clásica pierde el rumbo y el modelo aprendido conserva estabilidad.

De la clínica al casco doméstico

Zyphra ofrece ZUNA como herramienta integrable en flujos existentes, con código abierto y un paquete de Python pensado para preprocesar archivos, ejecutar inferencia y volver a formatos comunes. La lógica es pragmática: si el modelo se comporta como una pieza que encaja en la caja de herramientas del área, la comunidad puede evaluarlo sin rituales ni setups imposibles.

La utilidad más inmediata es la restauración de datos. En EEG, la pérdida de canales no solo baja calidad, también sesga conclusiones: el conjunto “usable” puede terminar siendo un subconjunto raro de pacientes más quietos, noches más tranquilas o equipos mejor calibrados. Un método que rescate sesiones defectuosas no solo suma volumen, también reduce ese sesgo silencioso. Zyphra lo plantea en términos directos: recuperar sesiones parcialmente inutilizables, mejorar hardware de pocos canales y reducir dependencia de montajes fijos como 10-20 o 10-10 usando coordenadas.

El salto hacia dispositivos de consumo tiene atractivo evidente. Los cascos con pocos electrodos prometen accesibilidad a cambio de resolución. Un sistema que amplíe canales y reconstruya puede acercar algunas mediciones a lo que ofrece un laboratorio sin obligar a cambiar hardware. No convierte un casco doméstico en equipo clínico, pero sí puede estabilizar aplicaciones y acelerar prototipos.

El término thought-to-text aparece en la narrativa de Zyphra como horizonte. Conviene ubicar esa ambición en la escala correcta. Los avances más espectaculares en conversión de actividad neural a texto provienen hoy de interfaces invasivas. En 2023, Nature publicó resultados de neuroprótesis del habla que decodifican intentos de hablar a partir de registros corticales de alta densidad, con desempeños ya medidos en velocidad y vocabulario. Esa señal no se parece al EEG de superficie, que es un resumen borroso de millones de neuronas.

Esa distancia no invalida el proyecto, lo aterriza. El EEG tiene la ventaja de la no invasividad y abre un universo de despliegues posibles, pero paga con relación señal ruido. Por eso, la ingeniería que limpia, reconstruye y estandariza importa tanto. Un sistema como ZUNA no “lee ideas” en el sentido popular, pero puede elevar la calidad de la materia prima sobre la que se entrenan decodificadores más específicos y facilitar comparaciones entre laboratorios.

Cuando el electrodo se despega y el ruido entra como un invitado grosero, lo que está en juego no es ciencia ficción. Es el derecho de la señal a existir. Si una red entrenada con millones de horas devuelve coherencia a un registro deshilachado, el salto cultural quizá sea silencioso. La próxima interfaz mental que cambie el juego podría empezar con algo más humilde: impedir que el cable suelto escriba la historia del cerebro.

Referencias

Zyphra, “ZUNA” (blog técnico). https://www.zyphra.com/post/zuna

ZUNA technical paper (Zyphra). https://www.zyphra.com/zuna-technical-paper

Ficha del modelo “Zyphra/ZUNA” en Hugging Face. https://huggingface.co/Zyphra/ZUNA

Repositorio de código “Zyphra/zuna” en GitHub. https://github.com/Zyphra/zuna

PR Newswire: “Zyphra Releases ZUNA - BCI Foundation Model Advancing Towards Thought-to-Text”. https://www.prnewswire.com/news-releases/zyphra-releases-zuna---bci-foundation-model-advancing-towards-thought-to-text-302691176.html

MNE-Python Documentation: “Handling bad channels” (interpolación por spline esférico). https://mne.tools/1.8/auto_tutorials/preprocessing/15_handling_bad_channels.html

Cui et al., “Neuro-GPT: Towards A Foundation Model for EEG” (arXiv:2311.03764). https://arxiv.org/abs/2311.03764

Liu et al., “EEG Foundation Models: Progresses, Benchmarking, and Open Problems” (arXiv:2601.17883). https://arxiv.org/abs/2601.17883

Willett et al., “A high-performance speech neuroprosthesis” (Nature, 2023). https://www.nature.com/articles/s41586-023-06377-x

Cómo Zyphra entrenó un modelo con datos de EEG a escala