GPT-4在考试中击败90％人类，中文准确性高达八成

当地时间3月14日，Open AI公开发布大型多模态模型GPT-4，与Chat GPT所用的模型相比，GPT-4不仅能够处理图像内容，且回复的准确性有所提高。

此外，几乎所有的办公室案头工作，GPT-4无所不能。比如，10秒钟就能做出一个网站。

Open AI还表示，GPT-4在许多专业测试中表现出超过绝大多数人类的水平。Open AI还称，GPT-4参加了多种基准考试测试，包括美国律师资格考试Uniform Bar Exam、法学院入学考试LSAT、“美国高考”SAT数学部分和证据性阅读与写作部分的考试，在这些测试中，它的得分高于88%的应试者。

“这是Open AI努力扩展深度学习的最新里程碑。”Open AI介绍，GPT-4在专业和学术方面表现出近似于人类的水平。例如，它在模拟律师考试中的得分能够排进前10%左右，相比之下，GPT-3.5的得分只能排在倒数10%左右。

与此前的GPT系列模型相比，GPT-4最大的突破之一是在文本之外还能够处理图像内容。Open AI表示，用户同时输入文本和图像的情况下，它能够生成自然语言和代码等文本。

目前图像处理功能还未公开，不过该公司在官网上展示了一系列案例。例如，输入如下图片并询问“这张图片有什么不寻常之处”，GPT-4可作出回答“这张照片的不同寻常之处在于，一名男子正在行驶中的出租车车顶上，使用熨衣板熨烫衣服。”

在官方演示中，GPT-4几乎就只花了1-2秒的时间，识别了手绘网站图片，并根据要求实时生成了网页代码制作出了几乎与手绘版一样的网站。

除了普通图片，GPT-4还能处理更复杂的图像信息，包括表格、考试题目截图、论文截图、漫画等，例如根据专业论文直接给出论文摘要和要点。

与此前的模型相比，GPT-4的准确性有所提高。Open AI称，该公司花费6个月的时间，利用对抗性测试程序和Chat GPT的经验教训迭代调整GPT-4，从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果，“至少对我们而言，GPT-4训练运行前所未有地稳定，成为首个能够提前准确预测其训练性能的大型模型。”

Open AI称，在公司内部的对抗性真实性评估中，GPT-4的得分比最新的GPT-3.5高40%，相应的“不允许内容请求的倾向”降低了82%，根据政策响应敏感请求（如医疗建议和自我伤害）的频率提高了29%。

不仅是英语，该模型在多种语言方面均表现出优越性。Open AI称，在测试的26种语言中，GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能。其中GPT-4的中文能够达到80.1%的准确性，而GPT-3.5的英文准确性仅为70.1%，GPT-4英文准确性提高到了85.5%。

不过，与早期的GPT模型一样，GPT-4仍然存在一定的局限性。

Open AI称，它并不完全可靠，可能会出现推理错误，“GPT-4缺乏对绝大多数数据切断后（2021年9月）发生的事件的了解，并且无法从中吸取经验教训……它有时会出现简单的推理错误，它会轻信用户明显的虚假陈述，有时它会像人类一样在难题上失败，例如在它生成的代码中引入安全漏洞。”

基于此，Open AI提醒，用户在使用语言模型时应格外小心，最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。

值得注意的是，GPT-4虽然于14日才正式公开，但早在一个月前，微软的新版搜索引擎必应（Bing）就已经在GPT-4上运行。微软表示，“如果您在过去五周内的任何时间使用过新版必应，那么您已经体验过GPT-4的早期版本。”

与免费的Chat GPT不同，GPT-4目前仅向Chat GPT Plus的付费用户开放，它也将作为API（应用程序编程接口）提供给企业及开发者，开发者需进入等候名单上，将该模型集成到他们的应用程序中。

Open AI表示，已经有多家公司将GPT-4搭载到他们的产品中，包括语言学习工具软件多邻国（Duolingo）、移动支付公司Stripe和可汗学院（Khan Academy）

来源 | 羊城晚报·羊城派综合澎湃新闻等

责编 | 冷爽

标签: 人工智能

GPT-4在考试中击败90％人类，中文准确性高达八成

最新资讯

2023北京银行北京城市副中心马拉松萌娃泡泡亲子跑 4月8日活力开跑

“学校不开了，此群解散！” 昆明家长懵了：交的钱咋办？

托朋友给孩子办入学近10万元“择校费”打水漂，报警数月至今仍未找到人，几名孩子险些没学上

年薪给你1000万，离开中国！

困在非学科类培训“大课包”里的家长，预付费课包动辄高达10万元

名校经济学硕士应聘基金公司研究岗，为啥连简历都投不进去？

文档百科

GPT-4在考试中击败90％人类，中文准确性高达八成

最新资讯

2023北京银行北京城市副中心马拉松萌娃泡泡亲子跑 4月8日活力开跑

“学校不开了，此群解散！” 昆明家长懵了：交的钱咋办？

托朋友给孩子办入学 近10万元“择校费”打水漂，报警数月至今仍未找到人，几名孩子险些没学上

年薪给你1000万，离开中国！

困在非学科类培训“大课包”里的家长，预付费课包动辄高达10万元

名校经济学硕士应聘基金公司研究岗，为啥连简历都投不进去？

文档百科

托朋友给孩子办入学近10万元“择校费”打水漂，报警数月至今仍未找到人，几名孩子险些没学上