排序
前谷歌科学家离职创业1年,自述训练LLM卡在算力上!
前谷歌大脑科学家Yi Tay去年3月离职后,创办了一家初创公司。创业一年,他发文表示「痛并快乐着」。 在这篇博文中,我讨论了: 1. 在不同计算提供商中采购计算和差异的经验。我们最大的发现/惊...
30天生效!美芯片禁令升级,仅剩V100可用?
就在刚刚,美国再次收紧对我国出口尖端AI芯片,英伟达A100、A800、H100、H800等无一幸免。当地时间10月17日,美国正式发布新规,全面收紧尖端AI芯片对华出口。商务部长雷蒙多表示,管制目的就是...
波士顿动力发布新一代Atlas机器人
大半夜的,本来想睡了。然后看到昨天在我朋友圈疯狂刷屏的波士顿动力,就在刚刚,又刷了一次屏。在如今AI和具身智能爆火的今天,人形机器人的明星公司波士顿动力,昨天宣布正式下线了他们的液压...
推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片
最近,两位哈佛辍学生共同创立的AI芯片公司,估值已达3400万美元,并计划明年交付一款名为「Sohu」的AI推理加速芯片——其LLM推理性能达到H100的10倍,而单价吞吐量更是高达140倍。像Pika一样...
DeepSeek满血微调秘籍来了
全网首发!DeepSeek V3/R1满血版低成本监督微调秘籍来了,让高达6710亿参数AI巨兽释放最强性能。DeepSeek V3/ R1火爆全网,基于原始模型的解决方案和API服务已随处可见,陷入低价和免费内卷。...
Efficient Computer称新CPU设计能效高达百倍,获1600万美元融资
2024年3月11日,初创企业Efficient Computer宣布其高能效Fabric架构Monza处理器测试芯片成功回片,并且获得了1600万美元的种子轮融资。Efficient Computer声称其新CPU设计能效比现有的微控...
130亿参数大模型塞进PC,没网也能生成PPT
全球最强性能CPU,一夜之间王座易主了。就在刚刚,骁龙峰会,高通旗下骁龙X Elite芯片正式亮相,专为PC笔记本打造,性能和功耗都创下行业新纪录。打开网易新闻 查看更多图片 发布会现场,大有“...
Meta新模型推理加速3倍,编程任务提高17%
“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样?Meta AI法国团队推出“基于多token预测的更快&更好大模型”。打开网易新闻 查看更多图片 多token预测模型,在...
小扎砸数百亿美元猛攻开源AGI!
今天,小扎正式宣战「开源AGI」!下一代大模型Llama 3正在训练,年底将拥有35万块H100,届时算力总和达60万块H100。为了追赶OpenAI,成立十年的FAIR团队纳入GenAI,全力奔赴AGI。自Llama2、Co...
DeepSeek开源DeepEP通信库
DeepSeek开源第二弹如期而至。这一次,他们把MoE训推EP通信库DeepEP开源了,支持FP8专为Hopper GPU设计,低延迟超高速训练推理。刚刚,DeepSeek放出了开源第二弹——DeepEP!它拥有高效优化的al...