排序
Meta新模型推理加速3倍,编程任务提高17%
“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样?Meta AI法国团队推出“基于多token预测的更快&更好大模型”。打开网易新闻 查看更多图片 多token预测模型,在...
小扎砸数百亿美元猛攻开源AGI!
今天,小扎正式宣战「开源AGI」!下一代大模型Llama 3正在训练,年底将拥有35万块H100,届时算力总和达60万块H100。为了追赶OpenAI,成立十年的FAIR团队纳入GenAI,全力奔赴AGI。自Llama2、Co...
侵吞全球算力!谷歌Gemini被曝算力达GPT-4五倍
知名的SemiAnalysis第三弹又来了!这次,作者爆料谷歌的Gemini消耗算力是GPT-4的整整5倍,手中没有足够GPU的人,在商业化战争中铁定出局。今天,著名的SemiAnalysis分析师Dylan Patel和Daniel N...
讯飞星火大模型升级3.0,刘庆峰:完全基于国产算力平台
·据科大讯飞董事长刘庆峰透露,在基础算力平台方面,目前讯飞星火大模型V3.0完全基于国产算力平台,将来大模型的4.0版本也将完全基于华为支持的算力平台。·刘庆峰对近日科大讯飞被曝学习机中...
微软入股,新模型直逼GPT-4,Mistral AI能成为下一个OpenAI?
AI圈又迎来重磅消息!继OpenAI之后,微软又将法国初创公司Mistral AI纳入麾下,Mistral AI是OpenAI在欧洲的有力竞争对手。获微软投资当地时间周一,微软宣布与Mistral AI建立合作伙伴关系,以...
AI时代发电厂在京浮出水面
人工智能毫无疑问是当今一项重要议题,通过大模型、垂类应用、智能体等多种方式推动着数字经济的发展。然而,服务AI的基础设施——算力和数据,是限制人工智能发展的瓶颈,也成了进一步讨论的...
AI算力产业链梳理
一、芯片1、算力芯片:见底龙芯中科、海光信息,其他:寒武纪、景嘉微、云天励飞等;2、光模块:中际旭创、天孚通信、太辰光、剑桥科技、九联科技、新易盛、联特科技、天孚通信、东田微、华工科...
Mamba架构第一次做大!混合Transformer,打败Transformer
精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
Efficient Computer称新CPU设计能效高达百倍,获1600万美元融资
2024年3月11日,初创企业Efficient Computer宣布其高能效Fabric架构Monza处理器测试芯片成功回片,并且获得了1600万美元的种子轮融资。Efficient Computer声称其新CPU设计能效比现有的微控...
离职创业一年,我才发现训练大模型有这么多坑
如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」...