快跑!传说中的GPT4真的来了!多模态,吊打旧版ChatGPT!

原文:快跑!传说中的GPT4真的来了!多模态,吊打旧版! - 知乎
目录
牛逼!!!
对不起,我实在没忍住说出这两个字!
过了一遍资料,先说结论:GPT4这波直接王炸!要不起!真的是遥遥领先!
刚晚上十一点还和同学讨论GPT4咋还没出来呢,我好像记成16号了,还想着这不是和百度的文心一言撞上了嘛,到时怕是免不了误伤啊 。
结果凌晨一点半突然刷到新闻,大脑有点爆炸,毕竟GPT4是个活在传说中很久的模型了,一时竟然不敢相信 。反复确认为真之后,一时有点恍惚,一来是有点晚了,头有点晕;二来,有点担心GPT4的效果,千呼万唤始出来,既怕它太强,又怕它不够强!忍不住翻身起床冲了杯麦片,挑灯夜战也要看看GPT到底有多强!
下面我们就来揭开GPT4的神秘面纱吧!
官网资料 官网简介:
We’veGPT-4, thein ’sinup deep . GPT-4 is a largemodel ( image and text ,text ) that, while lessthanin many real-world ,human-levelonand.
译文:我们创建了 GPT-4,这是 努力扩展深度学习的最新里程碑 。GPT-4 是一个大型多模态模型(接受图像和文本输入,发出文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平的表现 。
资源列表
卧槽,震惊!!!居然有paper,妈耶,以后我再也不喷为了 。
具体的,官方资源包括:
可以先加入GPT-4 API :
确认了一下, Plus确实已经接入GPT4了 。不说了,我先去充会员了!
GPT4官方解读 概览
我们创建了 GPT-4,这是努力扩展深度学习的最新里程碑 。GPT-4 是一个大型多模态模型(接受图像和文本输入,发出文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平的表现 。
具体介绍:
我们创建了 GPT-4,这是努力扩展深度学习的最新里程碑 。GPT-4 是一个大型多模态模型(接受图像和文本输入,发出文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平的表现 。例如,它通过了模拟律师考试,分数在应试者的前 10% 左右;相比之下,GPT-3.5 的得分在倒数 10% 左右 。我们花了 6 个月的时间 使用我们的对抗性测试程序和的经验教训迭代调整 GPT-4,从而在真实性、可操纵性和拒绝超出护栏方面取得了有史以来最好的结果(尽管远非完美) 。
在过去的两年里,我们重建了整个深度学习堆栈,并与 Azure 一起为我们的工作负载从头开始共同设计了一台超级计算机 。一年前,我们训练 GPT-3.5 作为系统的第一次“试运行” 。我们发现并修复了一些错误并改进了我们的理论基础 。结果,我们的 GPT-4 训练运行(至少对我们而言!)前所未有地稳定,成为我们能够提前准确预测其训练性能的第一个大型模型 。随着我们继续专注于可靠的扩展,我们的目标是完善我们的方法,以帮助我们越来越多地提前预测和准备未来的能力——我们认为这对安全至关重要 。
我们正在通过和 API(有候补名单)发布 GPT-4 的文本输入功能 。为了准备图像输入功能以获得更广泛的可用性,我们正在与一个合作伙伴密切合作 。我们还开源了 Evals,这是我们用于自动评估 AI 模型性能的框架,允许任何人报告我们模型中的缺点,以帮助指导进一步改进 。
能力
特性:
GPT4相比于旧版的,GPT-4 hasin:
在随意的谈话中,GPT-3.5 和 GPT-4 之间的区别可能很微妙 。当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令 。