El anhelo humano por delegar el pensamiento deductivo a las máquinas ha tropezado históricamente con un muro invisible: la diferencia entre parecer inteligente y serlo bajo las leyes inmutables de la lógica. En el panorama actual de la computación, donde las entidades de aprendizaje profundo han alcanzado una elocuencia que roza la paridad con el…
Humanity’s Last Exam: el benchmark de Nature que los modelos de IA no pueden superar
El Center for AI Safety y Scale AI publicaron en Nature el benchmark mas dificil jamas disenado para LLMs: 2.500 preguntas creadas por casi 1.000 expertos de 50 paises que los modelos mas avanzados del mundo no pueden responder. GPT-4o…
El examen matemático que las computadoras más avanzadas no pueden resolver
Las arquitecturas computacionales saturaron las métricas de evaluación tradicionales mediante un sofisticado reconocimiento de patrones. Ante la ilusión de un razonamiento perfecto, la élite científica diseña barreras infranqueables que revelan las verdaderas limitaciones del pensamiento automatizado y obligan a replantear…
Científicos descubrieron que los modelos de lenguaje tienen personalidades propias que nadie programó
Un equipo del MIT y la Universidad de California en San Diego publicó en la revista Science un método capaz de identificar y manipular, desde adentro, las representaciones abstractas de miedos, sesgos y personalidades que habitan en los sistemas de…
El grave defecto oculto de la inteligencia artificial
El Espejismo de la Inteligencia Operativa El cuatro de junio de mil novecientos noventa y seis, el cohete europeo Ariane cinco se desintegró treinta y nueve segundos después de su lanzamiento, esparciendo cientos de millones de dólares en equipo científico sobre la atmósfera terrestre. La causa de este fracaso catastrófico no radicó en un defecto…
OpenAI desplegará sus modelos en redes clasificadas del ejército de EE.UU. por primera vez
En menos de 24 horas, OpenAI selló un acuerdo con el Departamento de Guerra mientras Anthropic era declarada «riesgo para la cadena de suministro», una sanción históricamente reservada a adversarios extranjeros como Huawei. Detrás del escándalo, una disputa técnica y…
Cómo Anthropic pasó de socio estratégico del Pentágono a amenaza nacional en 24 horas
Anthropic rechazó la exigencia del Departamento de Defensa de eliminar todas las restricciones de uso sobre su modelo Claude, fue declarada «riesgo para la cadena de suministro nacional» por el secretario Pete Hegseth y enfrenta ahora una batalla legal sin…
KairosVL: El avance científico que permite a los algoritmos deducir causas mirando imágenes
La arquitectura fundacional de la computación moderna enfrenta un cisma irreconciliable cuando intenta procesar la naturaleza fluida de nuestra realidad empírica. Los sistemas algorítmicos contemporáneos han conquistado el espacio inmutable del lenguaje escrito y la estructura geométrica estática de las imágenes con una facilidad técnica que resulta abrumadora. Las redes neuronales profundas que habitan en…
OpenAI retiró su benchmark de código porque los modelos habían memorizado las respuestas
Cuando OpenAI reconoció que SWE-bench Verified estaba contaminado y lo retiró, confirmó lo que muchos sospechaban: los modelos de lenguaje habían aprendido las respuestas, no la materia. Un equipo de investigadores respondió con un sistema de evaluación que se renueva…
Perplexity lanzó una IA que completa proyectos enteros sin que el usuario haga nada más
La compañía presentó «Computer», un sistema que coordina 19 modelos especializados para ejecutar proyectos de principio a fin, desde la investigación inicial hasta el despliegue final. No es un chatbot más sofisticado: es una redefinición de lo que significa trabajar…










