算法/神经网络-开放智能

更新

浏览

Ascend C sqrt 算子实战

本文分享自华为云社区《【2023・CANN 训练营第一季】——Ascend C sqrt 算子实战》，作者：dayao。前言编写一个 Ascend C 的 sqrt 算子，并通过内核调用方式在 cpu 和 npu 模式下进行验证。在...

管理员2年前

83320

DeepSeek开源DeepEP通信库

DeepSeek开源第二弹如期而至。这一次，他们把MoE训推EP通信库DeepEP开源了，支持FP8专为Hopper GPU设计，低延迟超高速训练推理。刚刚，DeepSeek放出了开源第二弹——DeepEP！它拥有高效优化的al...

micro1个月前

24919

所有生命分子皆可AI预测！AlphaFold3来了

AlphaFold 3再登Nature！这次重磅升级，不再仅限于蛋白质结构预测——可以以前所未有的精度预测所有生命分子的结构和相互作用。只有了解它们如何在数百万种组合中相互作用，我们才能开始真正...

micro11个月前

23614

离职创业一年，我才发现训练大模型有这么多坑

如何在不到一年的时间里创办一家公司、筹集资金、购买芯片，并搭建出追赶 Gemini pro/GPT 3.5 的 LLM？很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇，但真正走完「从零开始」...

micro11个月前

2238

Meta新模型推理加速3倍，编程任务提高17%

“预测下一个token”被认为是大模型的基本范式，一次预测多个tokens又会怎样？Meta AI法国团队推出“基于多token预测的更快&更好大模型”。打开网易新闻查看更多图片多token预测模型，在...

micro11个月前

21710

OpenAI、Meta将推出拥有“推理”功能的AI

大型科技公司正忙着升级自家的大型语言模型。据报道，OpenAI和Meta即将发布各自的新版人工智能（AI）模型，他们声称这些模型将能够进行推理和规划，这是在机器中实现超人认知的关键步骤。本周，...

micro1年前

21611

揭秘HuggingFace规模最大、质量最高预训练数据集

从大规模网络爬取、精细过滤到去重技术，通过FineWeb的技术报告探索如何打造高质量数据集，为大型语言模型（LLM）预训练提供更优质的性能。大型语言模型（LLMs）的性能在很大程度上取决于它的...

micro10个月前

2155

在AMD卡上模拟CUDA，原版程序直接编译运行

无需任何修改转换，AMD显卡也跑起原版CUDA程序了！英国一家初创公司，推出了针对AMD的CUDA程序编译工具，而且免费商用。工具一经发布就引发了网友们的广泛热议，并登顶了HackerNews热榜。打开网...

micro9个月前

2048

455亿！刚刚，他又一次成为中国芯片首富！

年初，因王树国的加入，曹德旺斥资百亿筹建的福耀科技大学，再次火出圈。然而，企业家办学并不是个例。在宁波甬江北岸，有一处工地机械轰鸣、钢架林立，一所民办大学正如火如荼地在建设推进中...

micro11个月前

1935

港大北航等1bit大模型引热议，IEEE刊物评“解决AI能源需求”！

极限量化，把每个参数占用空间压缩到1.1bit！IEEE Spectrum专栏，一种名为BiLLM的训练后量化（PTQ）方法火了。通俗来讲，随着LLM参数规模越来越大，模型计算的内存和资源也面临着更大的挑战。...

micro10个月前

19013

加载更多

Ascend C sqrt 算子实战

DeepSeek开源DeepEP通信库

所有生命分子皆可AI预测！AlphaFold3来了

离职创业一年，我才发现训练大模型有这么多坑

Meta新模型推理加速3倍，编程任务提高17%

OpenAI、Meta将推出拥有“推理”功能的AI

揭秘HuggingFace规模最大、质量最高预训练数据集

在AMD卡上模拟CUDA，原版程序直接编译运行

455亿！刚刚，他又一次成为中国芯片首富！

港大北航等1bit大模型引热议，IEEE刊物评“解决AI能源需求”！

近期文章

近期评论