GPT-4如何碾压现有人工智能,让Google眼前一黑?

Google辛辛苦苦追赶ChatGPT好几个月,还没拿出什么具体对策,OpenAI今日又火上加油发布GPT-4模块,在这条人工智能赛道别说车尾灯,Google现在要担心的是被OpenAI套圈了。但究竟GPT-4有什么威力,和现在聊天好好玩的ChatGPT有什么差别?

大家肯定都听过GPT,但它的意思其实是生成式预训练变形器(Generative Pre-trained Transformer),第一代发表在2018年,2019发布GPT-2、2020推出GPT-3,直到2022年大幅优化后出现GPT-3.5,OpenAI再微调对话方式,就成了目前看到的ChatGPT。

OpenAI对发布ChatGPT其实有不同意见,工程师认为GPT-3.5的表现还不够好,应要等到更优秀的GPT-4成熟后再发布。就在GPT-3.5惊艳全球快半年后,GPT-4风光登场了。

相比前代,GPT-4多语言模块同时增加训练深度和广度,可产生处理32,768个token,每个token含25,000左右词汇,为了证明这件事,GPT-4参加多项人类考试,包括Bar Exam、LSAT和GRE等,并缴出惊人的成绩单。

GPT-4考试成绩单。

这些成绩代表若GPT-4是人类学生,完全可以考上法学院,或通过美国大部分大学测验,GPT-3.5除AP(美国大学先修课程测验)外成绩,几乎全面被GPT-4碾压。

如果用机器人考试程度看,机器学习跑分测试,GPT-4几乎都以10%以上差距击败市面所有大型语言模型。更特别的是,其他模型几乎都是以英语为主,通过Azure Translate模块将MMLU测试转译成多种语言后,GPT-4依然交出高水准成绩,中文部分准确率也达80%。

GPT-4多语言测试成绩。

除此之外,GPT-4导入图像文本复合模块,你各位最期待的能力之一终于降临。ChatGPT现在看得懂哏图,甚至解释哏图,且单张和多张都行。

GPT-4 multimodal demos.

It’s so over. AGI is coming.pic.twitter.com/ExMwTeOiMa

— Riley Goodside (@goodside)March 14, 2023

微软也同步表示,其实过去一个半月,如果用户试用新Bing浏览器和Bing Chat功能,应可感觉不同之处,因已提前导入GPT-4暖身。

OpenAI首席执行官Sam Altman也指出,终极目标是开发通用型AI,解放人类知识型工作。“但GPT-4还是有很多问题,也受到许多限制,第一次使用会让你惊艳,但用久了就会发现问题还在。”

(图片来源:OpenAI)