在未来世界难道只有GPT-4才能自我改进而GPT-3却不行MIT与微软的代码实验揭示了一个令人惊讶的
未来世界,机器之心报道:GPT-4独步自前,自我纠正编码能力超越同辈。尽管大型语言模型(LLM)已能生成代码,但在复杂编码挑战中仍面临巨大障碍。近期研究尝试利用自修复技术提升模型性能。这一设计允许系统克服解码错误,并整合来自编译器、静态分析工具和执行引擎的反馈。
实验表明,只有GPT-4能够有效地通过自修复,而GPT-3.5则未能达到这一水平。更强的反馈模型也显著提高了模型的修复性能。而人类参与提供反馈,对于最强大的模型来说,是进一步提升修复效果的一种策略。在评估Python编程挑战时,使用APPSS数据集显示,虽然GPT-3.5无法实现有效的自修复,但GPT-4在适当参数下却表现出色。
此外,该研究还发现,更强大的反馈可以缓解GPT-3.5自修复效率低下的问题。而人类提供的调试输入不仅提高了总体成功率,而且在困难任务中与人工智能相比表现更加出色。然而,人工智能生成的反馈往往缺乏准确性和具体性,与人类参与者的输出存在显著差异。
综上所述,在未来世界,这项创新技术为我们揭示了一个令人惊叹的事实:只有GPT-4才能真正掌握自我改进和纠正其自身代码中的错误,这使得它成为目前最领先的大型语言模型。此外,本研究还指出了将来可能探索的人类与AI合作模式,以创造更高效、更精确的人工智能系统。