排序
Ascend C sqrt 算子实战
本文分享自华为云社区《【2023・CANN 训练营第一季】——Ascend C sqrt 算子实战》,作者:dayao。 前言 编写一个 Ascend C 的 sqrt 算子,并通过内核调用方式在 cpu 和 npu 模式下进行验证。在...
DeepSeek开源DeepEP通信库
DeepSeek开源第二弹如期而至。这一次,他们把MoE训推EP通信库DeepEP开源了,支持FP8专为Hopper GPU设计,低延迟超高速训练推理。刚刚,DeepSeek放出了开源第二弹——DeepEP!它拥有高效优化的al...
所有生命分子皆可AI预测!AlphaFold3来了
AlphaFold 3再登Nature!这次重磅升级,不再仅限于蛋白质结构预测——可以以前所未有的精度预测所有生命分子的结构和相互作用。 只有了解它们如何在数百万种组合中相互作用,我们才能开始真正...
离职创业一年,我才发现训练大模型有这么多坑
如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」...
Meta新模型推理加速3倍,编程任务提高17%
“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样?Meta AI法国团队推出“基于多token预测的更快&更好大模型”。打开网易新闻 查看更多图片 多token预测模型,在...
OpenAI、Meta将推出拥有“推理”功能的AI
大型科技公司正忙着升级自家的大型语言模型。据报道,OpenAI和Meta即将发布各自的新版人工智能(AI)模型,他们声称这些模型将能够进行推理和规划,这是在机器中实现超人认知的关键步骤。本周,...
揭秘HuggingFace规模最大、质量最高预训练数据集
从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训练提供更优质的性能。大型语言模型(LLMs)的性能在很大程度上取决于它的...
在AMD卡上模拟CUDA,原版程序直接编译运行
无需任何修改转换,AMD显卡也跑起原版CUDA程序了!英国一家初创公司,推出了针对AMD的CUDA程序编译工具,而且免费商用。工具一经发布就引发了网友们的广泛热议,并登顶了HackerNews热榜。打开网...
455亿!刚刚,他又一次成为中国芯片首富!
年初,因王树国的加入,曹德旺斥资百亿筹建的福耀科技大学,再次火出圈。然而,企业家办学并不是个例。在宁波甬江北岸,有一处工地机械轰鸣、钢架林立,一所民办大学正如火如荼地在建设推进中...
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!
极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...