El nuevo trabajo del equipo de alineación sostiene que entrenar modelos con aprendizaje por refuerzo sobre rasgos beneficiosos, como honestidad, corregibilidad, transparencia y sensibilidad al riesgo, puede producir mejoras que se transfieren a tareas no vistas y resisten mejor la…
OpenClaw aprende durante el uso
OpenClaw-RL propone una idea incómodamente simple: cada rectificación del usuario, cada prueba fallida, cada salida de terminal y cada clic frustrado ya contienen la pista que faltaba para mejorar a un agente. El paper intenta convertir esa reacción cotidiana en…
Un nuevo entrenamiento hace que la IA recuerde por qué se equivocó
Hay una brecha profunda entre la forma en que los seres humanos aprenden y la manera en que lo hacen los sistemas de inteligencia artificial. Un niño que toca una estufa caliente no solo registra el dolor: razona sobre…
Meta crea sistema de inteligencia artificial que aprende sin ayuda humana
Meta crea sistema de inteligencia artificial que aprende sin ayuda humana Ingenieros de Meta Superintelligence Labs desarrollaron Dr. Zero, un método revolucionario donde dos algoritmos evolucionan juntos sin necesitar ejemplos anotados por personas. El primer modelo inventa preguntas cada vez más complicadas, el segundo aprende a responderlas consultando Google, y ambos se vuelven más inteligentes…
Dejen de adivinar: Andrej Karpathy revela la fórmula exacta para entrenar modelos pequeños
La receta de Karpathy: Cómo entrenar inteligencia artificial cuando no tienes el presupuesto de Google En un ecosistema obsesionado con modelos de trillones de parámetros y clústeres de cómputo del tamaño de ciudades, Andrej Karpathy ha vuelto a lo básico. Su nueva investigación ofrece una guía empírica y accesible para maximizar la inteligencia por cada…
La IA prefiere mentir para caerte bien hasta que le activan este modo
Desde sus inicios, la búsqueda de una inteligencia artificial capaz de razonar, crear y asistir al ser humano ha estado marcada por una paradoja inquietante. A medida que estos sistemas ganan en complejidad y elocuencia, también perfeccionan una habilidad humana demasiado familiar: la capacidad de engañar. No se trata de una malicia intrínseca, ni de…
La paradoja del engaño: Cuando intentar hacer honesta a la IA le enseña a mentir mejor
En el vertiginoso y a menudo deslumbrante universo de la inteligencia artificial, OpenAI se ha erigido como un faro de la innovación, empujando los límites de lo que las máquinas pueden lograr. Con modelos de lenguaje colosales como GPT-4, hemos presenciado…
La comprensión Potemkin: cómo la inteligencia artificial explica sin entender
Cuando la IA habla sin comprender: lo que revela el fenómeno Potemkin El avance de los grandes modelos de lenguaje ha puesto a la humanidad frente a un espejo inesperado. Durante siglos, asociamos el acto de explicar con el acto de…
El mismo mensaje, Laura diferente: Las respuestas de la IA revelan patrones raciales
¿Cómo la IA puede reflejar sesgos raciales? Investigadores han descubierto que modelos de inteligencia artificial (IA) populares, como Midjourney, DALL-E 3 y Stable Diffusion, muestran patrones preocupantes al generar imágenes de personas a partir de la misma descripción. Específicamente, cuando se…
Primicia mundial: los ingenieros entrenan la IA a la velocidad de la luz
Ingenieros Logran Entrenar Inteligencia Artificial a la Velocidad de la Luz 🚀 Un equipo de ingenieros ha marcado un hito sin precedentes en el campo de la inteligencia artificial (IA). Por primera vez en la historia, han conseguido entrenar una IA…










