排序
Ascend C sqrt 算子实战
本文分享自华为云社区《【2023・CANN 训练营第一季】——Ascend C sqrt 算子实战》,作者:dayao。 前言 编写一个 Ascend C 的 sqrt 算子,并通过内核调用方式在 cpu 和 npu 模式下进行验证。在...
Meta新模型推理加速3倍,编程任务提高17%
“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样?Meta AI法国团队推出“基于多token预测的更快&更好大模型”。打开网易新闻 查看更多图片 多token预测模型,在...
所有生命分子皆可AI预测!AlphaFold3来了
AlphaFold 3再登Nature!这次重磅升级,不再仅限于蛋白质结构预测——可以以前所未有的精度预测所有生命分子的结构和相互作用。 只有了解它们如何在数百万种组合中相互作用,我们才能开始真正...
离职创业一年,我才发现训练大模型有这么多坑
如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」...
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!
极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
六大顶尖高校联手发布全新Gen4Gen框架
文中提出了一个半自动数据集创建管道Gen4Gen,将个性化概念与文本描述结合成复杂的组合,创建了基准测试数据集MyCanvas,利用CP-CLIP 和 TI-CLIP指标证明了该方法的有效性。过去几年里,基于...
Mamba架构第一次做大!混合Transformer,打败Transformer
精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
455亿!刚刚,他又一次成为中国芯片首富!
年初,因王树国的加入,曹德旺斥资百亿筹建的福耀科技大学,再次火出圈。然而,企业家办学并不是个例。在宁波甬江北岸,有一处工地机械轰鸣、钢架林立,一所民办大学正如火如荼地在建设推进中...
首个国产全功能GPU的万卡集群来了!“中国英伟达”
纯国产GPU的万卡集群,它来了!而且还是国内首个全功能GPU,兼容CUDA的那种。 打开网易新闻 查看更多图片 这个集结了超过10000张高性能GPU的超复杂工程,它的算力有多大?不卖关子,直接揭...
英伟达不是硬件公司,英伟达代表一种未来的系统
老黄参加 'Squawk on the Street '节目,讨论 Nvidia 在下一代半导体方面的工作、加速计算背后的理论等老黄说B200是世界上最大的芯片有 2080 亿个晶体管,这个芯片的价格大约是3-4万美元,这一...