算法/神经网络共33篇
Ascend C sqrt 算子实战-开放智能

Ascend C sqrt 算子实战

本文分享自华为云社区《【2023・CANN 训练营第一季】——Ascend C sqrt 算子实战》,作者:dayao。 前言 编写一个 Ascend C 的 sqrt 算子,并通过内核调用方式在 cpu 和 npu 模式下进行验证。在...
管理员的头像-开放智能钻石会员管理员1年前
154310
智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer-开放智能

智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer

来自UC伯克利,港大等机构的研究人员,开创性地提出了一种「白盒」Transformer结构——CRATE。他们通过将数据从高维度分布压缩到低维结构分布,实现有效的表征,从而进一步实现了有竞争力的模型...
micro的头像-开放智能micro11个月前
06613
英伟达不是硬件公司,英伟达代表一种未来的系统-开放智能

英伟达不是硬件公司,英伟达代表一种未来的系统

老黄参加 'Squawk on the Street '节目,讨论 Nvidia 在下一代半导体方面的工作、加速计算背后的理论等老黄说B200是世界上最大的芯片有 2080 亿个晶体管,这个芯片的价格大约是3-4万美元,这一...
micro的头像-开放智能micro6个月前
01617
MIT华人用AI首次发现物理学全新方程-开放智能

MIT华人用AI首次发现物理学全新方程

 刚刚提出了KAN的MIT物理学家Max Tegmark和北大校友刘子鸣,又有一项重磅研究问世了!团队发现,它们用AI发现了物理学中的新方程,从此,AI很可能被引入物理学研究领域,帮助人类物理学家做出...
micro的头像-开放智能micro4个月前
01465
Gemini背后,谷歌真正可怕之处并不在模型本身-开放智能

Gemini背后,谷歌真正可怕之处并不在模型本身

 谷歌的大语言模型Gemini 1.0,一经问世就技惊四座。首先在性能方面,无论是从对文本、图像、音频的理解,还是对57种领域文本以及数学问题的推理,几乎都超过了自然语言界的霸主GPT-4。而且在...
micro的头像-开放智能micro10个月前
0976
芯片战争早已打响!谷歌15个月打造首个TPU-开放智能

芯片战争早已打响!谷歌15个月打造首个TPU

 在英伟达统治AI时代硬件的当下,谷歌的TPU却开辟了另一条道路。今天,小编带你了解第一块TPU的前世今生,同时揭开TPU架构的神秘面纱。在计算的历史上,曾被丢弃或过时的想法仍然很有趣,有时...
micro的头像-开放智能micro5个月前
01118
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!-开放智能

港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!

 极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
micro的头像-开放智能micro3个月前
016813
推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片-开放智能

推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片

 最近,两位哈佛辍学生共同创立的AI芯片公司,估值已达3400万美元,并计划明年交付一款名为「Sohu」的AI推理加速芯片——其LLM推理性能达到H100的10倍,而单价吞吐量更是高达140倍。像Pika一样...
micro的头像-开放智能micro10个月前
05811
Mamba架构第一次做大!混合Transformer,打败Transformer-开放智能

Mamba架构第一次做大!混合Transformer,打败Transformer

 精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
micro的头像-开放智能micro5个月前
01659
揭秘HuggingFace规模最大、质量最高预训练数据集-开放智能

揭秘HuggingFace规模最大、质量最高预训练数据集

 从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训练提供更优质的性能。大型语言模型(LLMs)的性能在很大程度上取决于它的...
micro的头像-开放智能micro3个月前
01505