OpenAI上新,发现ChatGPT代码输出错误的大模型来了!

美东时间6月27日周四,OpenAI公布,研究人员训练了一个基于 GPT-4 的模型名为 CriticGPT,用于捕捉ChatGPT 代码输出中的错误。据介绍,CriticGPT 旨在使用“从人类反馈中强化学习(RLHF)”的技术来训练、改进 GPT-4 的回答,以协助人类 AI 训练员完成工作。