当前大模型技术超全总结!
本文分为三个章节,深入浅出地解读大模型的技术,具体如下三个部分:1、GPT、LLaMA、ChatGLM、Falcon等大语言模型的技术细节比较在深入研究LLaMA、ChatGLM和Falcon等大语言模型时,我们不难发现...
500年前拉斐尔怎么作画,AI看一眼就知道
AI的跨界,只有想不到,没有办不到。艺术学家们用深度学习模型分析拉斐尔的画作,不仅能分析出用了什么颜料、怎么画的,还能知道500年前拿着画笔的是不是拉斐尔本人。DALL-E、MidJourney等工具...
陈丹琦团队新作:5%成本拿下SOTA,“羊驼剪毛”大法火了
只用3%的计算量、5%的成本取得SOTA,统治了1B-3B规模的开源大模型。这一成果来自普林斯顿陈丹琦团队,名为LLM-Shearing大模型剪枝法。打开网易新闻 查看更多图片 以羊驼LLaMA 2 7B为基础,通...
奥特曼投资前苹果员工创立,这家公司AI硬件炸圈,可访问ChatGPT
你的下一部手机,何必是手机?喏,就是这样一个别在衣领上的小玩意,已经支持访问ChatGPT了。 打开网易新闻 查看更多图片 它能胜任诸多智能手机能干的事,且更方便。按一下即可开启智能语...
LLM生成延迟降低50%!DeepSpeed团队发布FastGen
DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。GPT-4和LLaMA这样的大型语言模型(LLMs)已在各个层次上成为了集成AI 的主流服务应用。从常规聊天模型到文档摘要,从...
直追GPT-3.5,“欧洲版OpenAI”推出新模型
12月初,法国AI初创公司Mistral AI已正式结束其备受期待的A轮融资。据彭博社报道,公司已筹集了3.85亿欧元(约4.15亿美元),该公司的估值约为20亿美元。Mistral AI今天也开放了其商业平台。1...
OpenAI首个AI视频模型炸裂登场,端掉行业饭碗!
卷疯了卷疯了,短短十几小时内,OpenAI和谷歌接连发布核弹级成果。国内还没睡的人们,经历了过山车般的疯狂一晚。就在刚刚,OpenAI突然发布首款文生视频模型——Sora。简单来说就是,AI视频要变...
微软AI程序员登场,10倍AI工程师真来了?
全球首个AI程序员Devin诞生之后,让码农纷纷恐慌。没想到,微软同时也整出了一个AI程序员——AutoDev,能够自主生成、执行代码等任务。网友惊呼,AI编码发展太快了。全球首个AI程序员Devin的...
抱抱脸Open了OpenAI的秘密武器,网易参与复现
OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。最...
Meta新模型推理加速3倍,编程任务提高17%
“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样?Meta AI法国团队推出“基于多token预测的更快&更好大模型”。打开网易新闻 查看更多图片 多token预测模型,在...