El techo del 70%: por qué el benchmark FACTS es una alarma para la IA empresarial BENCHMARKS / FACTUALIDAD IA 2025 El techo del 70%: por qué el benchmark FACTS es una alarma para la IA empresarial Google y Kaggle acaban de ponerle número a algo que muchos equipos intuían: incluso los mejores modelos de…
El dilema de la honestidad en modelos afinados
La honestidad artificial bajo amenaza: cuando los modelos de lenguaje olvidan admitir su ignorancia En los laboratorios de la Universidad de Beihang en Pekín, un equipo de investigadores acaba de descubrir algo profundamente inquietante sobre los grandes modelos de lenguaje que…


