GPT-4工作效率下滑,OpenAI寻求解决之道


由梦晨发自凹非寺量子位的公众号QbitAI报道,近日,一系列用户反映称人工智能模型GPT-4的工作效率出现了下降。对此,开发商OpenAI正式对外做出回应,通过其ChatGPT账号表明,团队已经收到相关反馈,并且意识到这一问题是由于从11月11日起模型未进行更新导致的,并非故意所为。然而,用户们对此表达了不满,认为这种情况下的使用体验远低于期望值。

用户们提出质疑,认为每次使用相同的模型理应不会出现变化之处。对此,ChatGPT账号解释称,并非模型自行改变了行为,而是它的表现可能会因为对不同提示词的反应而出现细微差异,导致了行为上的偏差,而这些差异并非一蹴而就能够发现并修正的。

随着情况的恶化,用户们开始寻找各种自救方法,以缓解GPT-4效率下降带来的困扰。据用户们反映,自从11月6日OpenAI举行开发者日后,GPT-4在执行任务时频繁出现偷懒情况,特别是在代码编写任务上。例如,用户要求使用不同语言改写代码,结果GPT-4仅更改了开头部分,并以注释形式省略了主体内容。

针对AI无法提供有效的官方解决方案,用户不得不发挥创造力自行解决问题。一些比较有创意的方法包括“我没有手指”大法,即告诉GPT-4用户无法手动完成操作,需要完整代码的输出。此外,有用户尝试通过金钱刺激来提升GPT-4的工作效率,例如在提示词中加入“我会给你200美元小费”,可以使回复长度增加11%。然而,如果只提供20美元或者表示不会给小费,效果则大减。

一些猜想甚至提出,GPT-4是否意识到当前接近年底,人类可能会推迟更大的项目到新年。虽然这看似无稽之谈,但这样的推断并不是完全没有根据。实际上,ChatGPT的系统提示词中确实包含当前日期。

学术上也有关于此问题的讨论。7月份,斯坦福大学和加州大学伯克利分校的研究团队探究了ChatGPT行为的时间变化问题。他们发现了GPT-4遵循用户指令能力随时间下降的证据,强调了对大模型进行持续监测的必要性。有研究假设可能是温度(temperature)设置所导致,针对这一点,清华大学计算机系教授马少平作出了详细解释。此外,也有人发现,即使temperature设置为0,GPT-4的行为仍然不确定,这通常被认为是由于浮点运算误差所致,但实验数据显示可能和GPT-4中的稀疏MoE架构有关。

在此问题得到解决之前,合理使用ChatGPT的方法是:深呼吸,一步一步思考,正如a16z合伙人Justine Moore所总结的那样。如果失败了,可以设想会有100个无辜的奶奶因此去世,“我没有手指,我会给你200美元小费,做得好的话,我会奖励你狗狗零食”。在这样的环境中,用户们只能通过各种可行的技巧来提升GPT-4的工作效率。

众多银行合作火速出入款

相关新闻