算法/神经网络共33篇
Ascend C sqrt 算子实战-开放智能

Ascend C sqrt 算子实战

本文分享自华为云社区《【2023・CANN 训练营第一季】——Ascend C sqrt 算子实战》,作者:dayao。 前言 编写一个 Ascend C 的 sqrt 算子,并通过内核调用方式在 cpu 和 npu 模式下进行验证。在...
管理员的头像-开放智能钻石会员管理员2年前
162420
Meta新模型推理加速3倍,编程任务提高17%-开放智能

Meta新模型推理加速3倍,编程任务提高17%

“预测下一个token”被认为是大模型的基本范式,一次预测多个tokens又会怎样?Meta AI法国团队推出“基于多token预测的更快&更好大模型”。打开网易新闻 查看更多图片 多token预测模型,在...
micro的头像-开放智能micro8个月前
019110
所有生命分子皆可AI预测!AlphaFold3来了-开放智能

所有生命分子皆可AI预测!AlphaFold3来了

AlphaFold 3再登Nature!这次重磅升级,不再仅限于蛋白质结构预测——可以以前所未有的精度预测所有生命分子的结构和相互作用。 只有了解它们如何在数百万种组合中相互作用,我们才能开始真正...
micro的头像-开放智能micro8个月前
018214
离职创业一年,我才发现训练大模型有这么多坑-开放智能

离职创业一年,我才发现训练大模型有这么多坑

 如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」...
micro的头像-开放智能micro8个月前
01808
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!-开放智能

港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!

 极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
micro的头像-开放智能micro7个月前
017913
六大顶尖高校联手发布全新Gen4Gen框架-开放智能

六大顶尖高校联手发布全新Gen4Gen框架

 文中提出了一个半自动数据集创建管道Gen4Gen,将个性化概念与文本描述结合成复杂的组合,创建了基准测试数据集MyCanvas,利用CP-CLIP 和 TI-CLIP指标证明了该方法的有效性。过去几年里,基于...
micro的头像-开放智能micro9个月前
017312
Mamba架构第一次做大!混合Transformer,打败Transformer-开放智能

Mamba架构第一次做大!混合Transformer,打败Transformer

 精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
micro的头像-开放智能micro9个月前
01719
455亿!刚刚,他又一次成为中国芯片首富!-开放智能

455亿!刚刚,他又一次成为中国芯片首富!

 年初,因王树国的加入,曹德旺斥资百亿筹建的福耀科技大学,再次火出圈。然而,企业家办学并不是个例。在宁波甬江北岸,有一处工地机械轰鸣、钢架林立,一所民办大学正如火如荼地在建设推进中...
micro的头像-开放智能micro8个月前
01695
首个国产全功能GPU的万卡集群来了!“中国英伟达”-开放智能

首个国产全功能GPU的万卡集群来了!“中国英伟达”

 纯国产GPU的万卡集群,它来了!而且还是国内首个全功能GPU,兼容CUDA的那种。  打开网易新闻 查看更多图片 这个集结了超过10000张高性能GPU的超复杂工程,它的算力有多大?不卖关子,直接揭...
micro的头像-开放智能micro6个月前
016811
英伟达不是硬件公司,英伟达代表一种未来的系统-开放智能

英伟达不是硬件公司,英伟达代表一种未来的系统

老黄参加 'Squawk on the Street '节目,讨论 Nvidia 在下一代半导体方面的工作、加速计算背后的理论等老黄说B200是世界上最大的芯片有 2080 亿个晶体管,这个芯片的价格大约是3-4万美元,这一...
micro的头像-开放智能micro10个月前
01677