算法/神经网络共34篇
Ascend C sqrt 算子实战-开放智能

Ascend C sqrt 算子实战

本文分享自华为云社区《【2023・CANN 训练营第一季】——Ascend C sqrt 算子实战》,作者:dayao。 前言 编写一个 Ascend C 的 sqrt 算子,并通过内核调用方式在 cpu 和 npu 模式下进行验证。在...
管理员的头像-开放智能钻石会员管理员2年前
83320
DeepSeek开源DeepEP通信库-开放智能

DeepSeek开源DeepEP通信库

DeepSeek开源第二弹如期而至。这一次,他们把MoE训推EP通信库DeepEP开源了,支持FP8专为Hopper GPU设计,低延迟超高速训练推理。刚刚,DeepSeek放出了开源第二弹——DeepEP!它拥有高效优化的al...
micro的头像-开放智能micro1个月前
24919
所有生命分子皆可AI预测!AlphaFold3来了-开放智能

所有生命分子皆可AI预测!AlphaFold3来了

AlphaFold 3再登Nature!这次重磅升级,不再仅限于蛋白质结构预测——可以以前所未有的精度预测所有生命分子的结构和相互作用。 只有了解它们如何在数百万种组合中相互作用,我们才能开始真正...
micro的头像-开放智能micro11个月前
23614
离职创业一年,我才发现训练大模型有这么多坑-开放智能

离职创业一年,我才发现训练大模型有这么多坑

 如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」...
micro的头像-开放智能micro11个月前
2238
Meta新模型推理加速3倍,编程任务提高17%-开放智能

Meta新模型推理加速3倍,编程任务提高17%

“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样?Meta AI法国团队推出“基于多token预测的更快&更好大模型”。打开网易新闻 查看更多图片 多token预测模型,在...
micro的头像-开放智能micro11个月前
21710
OpenAI、Meta将推出拥有“推理”功能的AI-开放智能

OpenAI、Meta将推出拥有“推理”功能的AI

大型科技公司正忙着升级自家的大型语言模型。据报道,OpenAI和Meta即将发布各自的新版人工智能(AI)模型,他们声称这些模型将能够进行推理和规划,这是在机器中实现超人认知的关键步骤。本周,...
micro的头像-开放智能micro1年前
21611
揭秘HuggingFace规模最大、质量最高预训练数据集-开放智能

揭秘HuggingFace规模最大、质量最高预训练数据集

 从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训练提供更优质的性能。大型语言模型(LLMs)的性能在很大程度上取决于它的...
micro的头像-开放智能micro10个月前
2155
在AMD卡上模拟CUDA,原版程序直接编译运行-开放智能

在AMD卡上模拟CUDA,原版程序直接编译运行

无需任何修改转换,AMD显卡也跑起原版CUDA程序了!英国一家初创公司,推出了针对AMD的CUDA程序编译工具,而且免费商用。工具一经发布就引发了网友们的广泛热议,并登顶了HackerNews热榜。打开网...
micro的头像-开放智能micro9个月前
2048
455亿!刚刚,他又一次成为中国芯片首富!-开放智能

455亿!刚刚,他又一次成为中国芯片首富!

 年初,因王树国的加入,曹德旺斥资百亿筹建的福耀科技大学,再次火出圈。然而,企业家办学并不是个例。在宁波甬江北岸,有一处工地机械轰鸣、钢架林立,一所民办大学正如火如荼地在建设推进中...
micro的头像-开放智能micro11个月前
1935
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!-开放智能

港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!

 极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
micro的头像-开放智能micro10个月前
19013