算力-开放智能-第3页

更新

浏览

Meta新模型推理加速3倍，编程任务提高17%

“预测下一个token”被认为是大模型的基本范式，一次预测多个tokens又会怎样？Meta AI法国团队推出“基于多token预测的更快&更好大模型”。打开网易新闻查看更多图片多token预测模型，在...

micro5个月前

018510

小扎砸数百亿美元猛攻开源AGI！

今天，小扎正式宣战「开源AGI」！下一代大模型Llama 3正在训练，年底将拥有35万块H100，届时算力总和达60万块H100。为了追赶OpenAI，成立十年的FAIR团队纳入GenAI，全力奔赴AGI。自Llama2、Co...

micro9个月前

08610

侵吞全球算力！谷歌Gemini被曝算力达GPT-4五倍

知名的SemiAnalysis第三弹又来了！这次，作者爆料谷歌的Gemini消耗算力是GPT-4的整整5倍，手中没有足够GPU的人，在商业化战争中铁定出局。今天，著名的SemiAnalysis分析师Dylan Patel和Daniel N...

innov1年前

011710

讯飞星火大模型升级3.0，刘庆峰：完全基于国产算力平台

·据科大讯飞董事长刘庆峰透露，在基础算力平台方面，目前讯飞星火大模型V3.0完全基于国产算力平台，将来大模型的4.0版本也将完全基于华为支持的算力平台。·刘庆峰对近日科大讯飞被曝学习机中...

micro1年前

0589

微软入股，新模型直逼GPT-4，Mistral AI能成为下一个OpenAI？

AI圈又迎来重磅消息！继OpenAI之后，微软又将法国初创公司Mistral AI纳入麾下，Mistral AI是OpenAI在欧洲的有力竞争对手。获微软投资当地时间周一，微软宣布与Mistral AI建立合作伙伴关系，以...

micro8个月前

0839

AI时代发电厂在京浮出水面

人工智能毫无疑问是当今一项重要议题，通过大模型、垂类应用、智能体等多种方式推动着数字经济的发展。然而，服务AI的基础设施——算力和数据，是限制人工智能发展的瓶颈，也成了进一步讨论的...

micro2个月前

01419

AI算力产业链梳理

一、芯片1、算力芯片：见底龙芯中科、海光信息，其他：寒武纪、景嘉微、云天励飞等；2、光模块：中际旭创、天孚通信、太辰光、剑桥科技、九联科技、新易盛、联特科技、天孚通信、东田微、华工科...

innov1年前

01209

Mamba架构第一次做大！混合Transformer，打败Transformer

精彩精彩，第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数，还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻查看更多图片取两种架构之长，模型质量和效率兼得...

micro6个月前

01679

Efficient Computer称新CPU设计能效高达百倍，获1600万美元融资

2024年3月11日，初创企业Efficient Computer宣布其高能效Fabric架构Monza处理器测试芯片成功回片，并且获得了1600万美元的种子轮融资。Efficient Computer声称其新CPU设计能效比现有的微控...

micro7个月前

0978

离职创业一年，我才发现训练大模型有这么多坑

如何在不到一年的时间里创办一家公司、筹集资金、购买芯片，并搭建出追赶 Gemini pro/GPT 3.5 的 LLM？很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇，但真正走完「从零开始」...