首页 原创 深1度 24小时 洞见 突发 娱乐 传媒 IT 电脑 软件 手机 通信 科教 游戏 科技 网络 物联网 智汽车 云计算 大数据 医疗 电商 数码 金融 教育 交通 物流 消费 AI 区块链
当前位置: 首页 > 区块链 > 正文

全球首个开源GPT-4来了!Meta正式推出Llama 3 即将追上OpenAI

2024-04-19 15:08:01 来源:互联网   

  脸书母公司Meta周四宣布推出新一代大语言模型Llama 3.共有80亿和700亿参数两种版本,用了24000块GPU、15万亿个token训练训练的Llama 3一亮相便登上开源大模型铁王座,而随着推理编码大幅提升,代码和权重全开源,加上4000 亿参数的版本也正在开发,专家认为4000亿参数的版本推出后将是全球首个开源GPT-4级别的模型。

  Meta这次推出的80亿和700亿参数模型分别有预训练和指令微调两种版本,Meta也声称Llama 3性能优于Claude Sonnet、Mistral Medium和GPT-3.5.

  80亿参数版本让所有人都能接触最前端的AI技术,全球各地的开发人员、研究人员都可以借此进行游戏、建造和实验,不过上下文长度相较之前虽增加一倍,但依然只能一次生成8千字。

  Meta 也预告,接下来几个月将发布多个新功能的模型,包括多语言对话、更长上下文,以及整体能力提升。

  在性能上,8B和70B显著优于Llama 2.取代了SOTA,预训练模型和指令微调模型在8B和70B的参数规模上取得了如此先进的性能,都是得益于预训练和训练后的改进。

  此外,Llama 3已能在网页版Meta AI使用且免登录,AI模型资源平台Hugging Face共同创办人兼首席执行官表示:「Llama 1和2现已衍生出3万个新模型,Llama 3将给AI生态带来更大冲击。 」

  不过,80亿跟700亿参数版本的Llama 3还只是开胃菜,Llama 3的4000亿参数版本不久便要解禁,目前还在训练中,其中预训练版本在推理挑战测试集ARC-Challenge上拿下96的高分,Llama 3的4000亿参数指令微调版更在数学、代码、 大规模多任务语言理解基准上表现非常亮眼。

  英伟达高级科学家范麟熙将 Llama 3 的 4000 亿参数版本与 Claude 3 Opus、GPT-4-2024-04-09 版和 Gemini 在同基准数据中进行对比,结果显示 Llama 3 的 4000 亿参数版本在多语言推理任务跟代码能力,已经能跟 GPT-4、Claude 3 相匹敌,甚至完全胜过 Gemini Ultra 1.0.

  OpenAI共同创办人兼AI研究员Andrej Karpathy认为,Llama 3的4000亿参数版本将会是首个开源GPT-4级别的模型,范麟熙也说Llama 3的4000亿参数版本将成为一个分水岭,将改变许多研究工作和草根创业公司的计算方式。

  OpenAI研究科学家Will Depue也表达同样看法,认为Llama 3的4000亿参数版本将让未来的可能性无穷无尽,非常期待这样一款开源GPT-4级别的模型。

标签:
广告、内容合作请点这里:寻求合作