开源 第3页
3140亿参数Grok-1推理加速3.8倍-开放智能

3140亿参数Grok-1推理加速3.8倍

马斯克说到做到开源Grok-1,开源社区一片狂喜。但基于Grok-1做改动or商用,都还有点难题:Grok-1使用Rust+JAX构建,对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。打开网...
micro的头像-开放智能micro1年前
21610
吴恩达开源大模型套件:11个模型平台一种方式调用-开放智能

吴恩达开源大模型套件:11个模型平台一种方式调用

吴恩达发布的开源大模型套件aisuite,不到半天就斩获了1200+星标(同步更新时已有1.8k)。它把11家知名大模型平台集中到了一起,统一了接口,可以用相同的方式调用不同模型。切换模型时,只需要...
micro的头像-开放智能micro5个月前
28980
智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer-开放智能

智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer

来自UC伯克利,港大等机构的研究人员,开创性地提出了一种「白盒」Transformer结构——CRATE。他们通过将数据从高维度分布压缩到低维结构分布,实现有效的表征,从而进一步实现了有竞争力的模型...
micro的头像-开放智能micro2年前
8213
清华系大模型公司扎堆,真抱团还是假情谊?-开放智能

清华系大模型公司扎堆,真抱团还是假情谊?

   图源:Unsplash如果给中国大模型企业的创业图谱建立一个坐标系,位于清华大学东门外十字路口一侧的搜狐网络大厦或许是最合适的坐标原点。张朝阳可能也没想到,昔日互联网风水宝地,如今承...
micro的头像-开放智能micro1年前
20410
开源AI模型正在超越专有模型,LeCun大赞-开放智能

开源AI模型正在超越专有模型,LeCun大赞

 最近,这张号称「或许是2024年最重要的AI图之一」的图开始热转,可以看到,开源本地模型,已经取代了大规模、基于云的昂贵封闭模型,这种转变令人兴奋、着迷。最近,这张图开始在AI社区热转,...
micro的头像-开放智能micro2年前
7013
北大发起 Open-Sora计划:旨在复现Sora模型-开放智能

北大发起 Open-Sora计划:旨在复现Sora模型

  北京大学Yuangroup团队发起了一个 Open-Sora开源计划,旨在复制OpenAI(close AI)的视频生成模型sora‍ 本项目希望通过开源社区的力量复现Sora,由北大-兔展AIGC联合实验室共同发起,当前...
micro的头像-开放智能micro1年前
1459
腾讯混元开放代码和算法,可免费商用-开放智能

腾讯混元开放代码和算法,可免费商用

 随着AIGC的逐渐普及,你有没有发现越来越多的人开始用大模型自制微信头像?不过,许多文生图大模型仍然存在诸多不足,例如质感不强、图像畸变等。而今,秉持着实用研发思路的腾讯混元文生图大...
micro的头像-开放智能micro11个月前
2209
AI Agent,启动!复旦NLP团队发86页长文综述-开放智能

AI Agent,启动!复旦NLP团队发86页长文综述

近日,一篇探讨基于LLM的Agent综述论文在X上火了!仔细一看,论文署名中甚至一度还有米哈游。9月19日,Jim Fan转发了一篇来自复旦NLP团队对基于LLM的Agent的综述。Agent是能够感知自身所处环境...
micro的头像-开放智能micro2年前
17610
新开源之王来了!1320亿参数,还比Llama2-70B快1倍-开放智能

新开源之王来了!1320亿参数,还比Llama2-70B快1倍

“最强”开源大模型之争,又有新王入局:大数据巨头Databricks,刚刚发布MoE大模型DBRX,并宣称: 它在基准测试中击败了此前所有开源模型。 包括同为混合专家模型的Grok-1和Mixtral。打开网易...
micro的头像-开放智能micro1年前
19710
美国朝DeepSeek打了一记重拳,斯坦福团队花146元复现AI模型-开放智能

美国朝DeepSeek打了一记重拳,斯坦福团队花146元复现AI模型

围绕中国开源 AI 公司深度求索(DeepSeek)热潮不断加剧,已成为全民热议的话题,同时也掀起一股新的AI热潮。而当前,美国企业界、学术界、政府机构纷纷开启“反击”热潮。首先是美国企业层面,...
micro的头像-开放智能micro1个月前
15712