OpenAI正式推出GPT-4大型语言模型，ChatGPT更聪明了

OpenAI刚刚公布了其大型语言模型的最新版本 ——GPT-4。

GPT-4可以更准确地解决你的难题，多模态的GPT-4还可以生成、编辑具有创意性或技术性的文章，在高级推理方面的表现超过其前辈（当前公开版ChatGPT基于GPT-3.5）。当然，正如大家所猜测的那样，微软New Bing的聊天功能确实基于GPT-4。

此外，该公司正在与合作伙伴Be My Eyes一起测试GPT-4的图像输入能力（注：Be My Eyes是一款即将推出的智慧手机App，可以识别场景并对其进行描述，类似于大家常见的AI识图的加强版）。

除了介绍网站，OpenAI还提供了描述GPT-4功能的技术性论文，以及详细描述其局限性的系统模型Card。

OpenAI计划通过ChatGPT及其商业API为用户提供GPT-4的文本功能支持，但目前还需要等待。这里需要提醒一下，GPT4目前仅ChatGPT plus账号可用，可选GPT4模式进行对话，每4小时限制发送100条消息。

收费方面，大约750个单词的提示收取约3美分的费用，约750个单词的响应则收取6美分（就是问和答的区别）。

据介绍，GPT-4比以前的版本“更大”，这意味着它已经借助比前辈更多的资料进行了训练，并且在模型文件中有更多的权重，从而使得它的运行成本更高。

就任务而言，GPT-4的表现比前辈更好，它可以遵循自然语言的复杂指令并生成技术或创意内容，而且它可以还更深入地做到这一点：它支持生成和处理多达32768个标记（约25000个文本单词），从而实现比前辈更长的内容创建或文本分析。

OpenAI表示，GPT-4错误答案更少，而且也会减少偏离话题的可能，也尽可能不会再谈论禁忌话题，甚至在许多标准化测试中比人类表现得都要更好一些。

例如，GPT-4在模拟律师考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右。相比之下，GPT-3.5在律师考试中的得分一般都是倒数10%左右。当然，它们考个研究生还是没问题的。

当然，AI毕竟是AI，OpenAI也表示目前GPT-4并不完美，它在很多场景下的能力都不如人类。

该模型仍然有“幻觉”或编造事实的问题，并且在事实方面也不一定总是可靠的，“它倾向于坚持认为它是正确的，即使它错了”。OpenAI表示，GPT-4正在努力解决其局限性，例如社会偏见、幻觉和对抗性提示。