Nuevas estrategias de verificación por OpenAI en IA

Descubre cómo OpenAI optimiza la verificación y claridad en IA

El equipo de OpenAI ha descubierto que enfocarse únicamente en la corrección de respuestas en modelos de IA puede complicar la comprensión de las soluciones. Este descubrimiento subraya la necesidad de priorizar no solo la precisión, sino también la claridad y la facilidad de verificación en los textos generados por inteligencia artificial. Aquí es donde los mecanismos de ‘comprobación’ y ‘verificación’ resultan cruciales.

Mediante la implementación de un ‘comprobador’ que elabora una solución y un ‘verificador’ que evalúa su precisión, se asegura que los resultados sean no solo correctos, sino también comprensibles tanto para humanos como para otros sistemas de IA. Esto permite desarrollar aplicaciones de IA más eficientes y fiables, beneficiando diversos sectores que requieren una comunicación precisa y clara.

Cómo funciona la verificación de IA

Para aumentar la legibilidad, se mejoró el proceso de pensamiento en problemas matemáticos básicos para que pudieran ser verificados por modelos de menor capacidad, investigando si esto mejora su comprensión humana. El probador genera textos comprensibles para humanos siguiendo un esquema de entrenamiento que exige que el modelo más avanzado produzca soluciones que un modelo menos avanzado, el verificador, pueda validar fácilmente.

A pesar de que algunas soluciones iniciales resultaron incorrectas debido a errores inherentes al modelo de demostración, se alternaron rondas de entrenamiento entre dos fases: una donde el modelo verificador débil predice la precisión de las soluciones del probador y otra donde el modelo probador más robusto actúa de manera ‘útil’ o ‘furtiva’.

Los resultados indicaron que el probador astuto puede crear soluciones incorrectas que engañan al verificador. Sin embargo, al integrar estas respuestas incorrectas en la siguiente etapa de entrenamiento del verificador, se forzó al probador a explorar nuevas estrategias en cada ciclo. El entrenamiento concluyó cuando el probador astuto ya no pudo engañar al verificador con respuestas erróneas.

Por tanto, esta investigación concluye que en áreas críticas y aplicaciones complejas, es cada vez más vital asegurar la fiabilidad y legibilidad de los resultados. OpenAI, enfocándose en mejorar la autonomía en legibilidad, destaca la importancia de esta característica para la alineación de futuros sistemas de IA superinteligentes.