排序
当AI搜索开始赚钱养家
近期,在GPT-4o创造的新范式影响下,月暗、智谱、Perplexity和OpenAI相继上线了AI搜索推理功能。与此前“大海捞针”不同,最近更新中AI搜索长了“脑子”,在面对问题时,能像人一样先拆解步骤,...
AI时代发电厂在京浮出水面
人工智能毫无疑问是当今一项重要议题,通过大模型、垂类应用、智能体等多种方式推动着数字经济的发展。然而,服务AI的基础设施——算力和数据,是限制人工智能发展的瓶颈,也成了进一步讨论的...
在AMD卡上模拟CUDA,原版程序直接编译运行
无需任何修改转换,AMD显卡也跑起原版CUDA程序了!英国一家初创公司,推出了针对AMD的CUDA程序编译工具,而且免费商用。工具一经发布就引发了网友们的广泛热议,并登顶了HackerNews热榜。打开网...
首个国产全功能GPU的万卡集群来了!“中国英伟达”
纯国产GPU的万卡集群,它来了!而且还是国内首个全功能GPU,兼容CUDA的那种。 打开网易新闻 查看更多图片 这个集结了超过10000张高性能GPU的超复杂工程,它的算力有多大?不卖关子,直接揭...
455亿!刚刚,他又一次成为中国芯片首富!
年初,因王树国的加入,曹德旺斥资百亿筹建的福耀科技大学,再次火出圈。然而,企业家办学并不是个例。在宁波甬江北岸,有一处工地机械轰鸣、钢架林立,一所民办大学正如火如荼地在建设推进中...
离职创业一年,我才发现训练大模型有这么多坑
如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」...
Meta新模型推理加速3倍,编程任务提高17%
“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样?Meta AI法国团队推出“基于多token预测的更快&更好大模型”。打开网易新闻 查看更多图片 多token预测模型,在...
波士顿动力发布新一代Atlas机器人
大半夜的,本来想睡了。然后看到昨天在我朋友圈疯狂刷屏的波士顿动力,就在刚刚,又刷了一次屏。在如今AI和具身智能爆火的今天,人形机器人的明星公司波士顿动力,昨天宣布正式下线了他们的液压...
Mamba架构第一次做大!混合Transformer,打败Transformer
精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
对标英伟达的“唯一巨星”,要IPO了
国内芯片半导体领域突然传来重磅消息,“批量全球资本加持的巨星”要IPO了。投资家网获悉,智驾科技独角兽地平线(Horizon Robotics)近日正式向港交所递交招股书,高盛、摩根士丹利、中信建...