抱抱脸Open了OpenAI的秘密武器,网易参与复现
OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。最...
开源版AI程序员来了:GPT-4加持,能力比肩Devin
最近,有很多人在为 AI 代替自己的工作而担忧。上个月火遍 AI 圈的「首位 AI 程序员」Devin,利用大模型能力已经掌握了全栈技能,仅需要人类给出自然语言指令,就可以自动完成复杂的代码任务...
AI下一站:从”复活”明星到数字永生?
最近,用AI“复活”逝者这件事,着实是火出了圈,从包小柏用AI复活自己女儿,到各种用AI复活明星的视频,我们发现,通过AI技术,让死者“重回人间”似乎成了一件轻而易举的事。打开网易新闻 ...
阿里1号AI「员工」上岗,007写代码助攻大厂程序员!
阿里云最近入职的这位新员工,程序员们看了拍手叫好!每天,它都有数百万行代码被采用,单日推理次数超两千万。007敲代码,兢兢业业改bug,从不抱怨。它不抢程序员饭碗,主打辅助!就在刚刚,...
天工大模型3.0将于4月17日发布,并将同步开源
日前昆仑万维方面宣布,天工大模型3.0将于4月17日、即天工大模型发布一周年之际开启公测,并将同步开源。据了解,天工3.0采用4千亿级参数MoE混合专家模型,号称是全球模型参数最大、性能最强...
国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI
LLM战场的新玩家,一出手就是王炸!信仰Scaling Law的阶跃星辰,一口气带来了Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版。而阶跃星辰...
开源五连招,其中三个是MoE
大模型的快节奏发展,让了解最新技术动态、积极主动学习成为每一位从业者的必修课。 InfoQ研究中心期望通过每周更新大模型行业最新动态,为广大读者提供全面的行业回顾和要点分析。现在,让我...
OpenAI遭遇研发谜团:有时大模型很难学会,过后又能突然学会
两年前,OpenAI的研究人员尤里·布尔达(Yuri Burda)和哈里·爱德华兹(Harri Edwards)曾试图找出如何让一个大型语言模型进行基本运算。打开网易新闻 查看更多图片 (来源:OpenAI 官网)他们...
Mamba架构第一次做大!混合Transformer,打败Transformer
精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
对标英伟达的“唯一巨星”,要IPO了
国内芯片半导体领域突然传来重磅消息,“批量全球资本加持的巨星”要IPO了。投资家网获悉,智驾科技独角兽地平线(Horizon Robotics)近日正式向港交所递交招股书,高盛、摩根士丹利、中信建...