人工智能，开源，开源代码，开源项目-第3页

3140亿参数Grok-1推理加速3.8倍

马斯克说到做到开源Grok-1，开源社区一片狂喜。但基于Grok-1做改动or商用，都还有点难题：Grok-1使用Rust+JAX构建，对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。打开网...

micro1年前

21610

吴恩达开源大模型套件：11个模型平台一种方式调用

吴恩达发布的开源大模型套件aisuite，不到半天就斩获了1200+星标（同步更新时已有1.8k）。它把11家知名大模型平台集中到了一起，统一了接口，可以用相同的方式调用不同模型。切换模型时，只需要...

micro5个月前

28980

智能的本质就是压缩？马毅团队5年心血提出「白盒」Transformer

来自UC伯克利，港大等机构的研究人员，开创性地提出了一种「白盒」Transformer结构——CRATE。他们通过将数据从高维度分布压缩到低维结构分布，实现有效的表征，从而进一步实现了有竞争力的模型...

micro2年前

8213

清华系大模型公司扎堆，真抱团还是假情谊？

图源：Unsplash如果给中国大模型企业的创业图谱建立一个坐标系，位于清华大学东门外十字路口一侧的搜狐网络大厦或许是最合适的坐标原点。张朝阳可能也没想到，昔日互联网风水宝地，如今承...

micro1年前

20410

开源AI模型正在超越专有模型，LeCun大赞

最近，这张号称「或许是2024年最重要的AI图之一」的图开始热转，可以看到，开源本地模型，已经取代了大规模、基于云的昂贵封闭模型，这种转变令人兴奋、着迷。最近，这张图开始在AI社区热转，...

micro2年前

7013

北大发起 Open-Sora计划：旨在复现Sora模型

北京大学Yuangroup团队发起了一个 Open-Sora开源计划，旨在复制OpenAI（close AI）的视频生成模型sora‍ 本项目希望通过开源社区的力量复现Sora，由北大-兔展AIGC联合实验室共同发起，当前...

micro1年前

1459

腾讯混元开放代码和算法，可免费商用

随着AIGC的逐渐普及，你有没有发现越来越多的人开始用大模型自制微信头像？不过，许多文生图大模型仍然存在诸多不足，例如质感不强、图像畸变等。而今，秉持着实用研发思路的腾讯混元文生图大...

micro11个月前

2209

AI Agent，启动！复旦NLP团队发86页长文综述

近日，一篇探讨基于LLM的Agent综述论文在X上火了！仔细一看，论文署名中甚至一度还有米哈游。9月19日，Jim Fan转发了一篇来自复旦NLP团队对基于LLM的Agent的综述。Agent是能够感知自身所处环境...

micro2年前

17610

新开源之王来了！1320亿参数，还比Llama2-70B快1倍

“最强”开源大模型之争，又有新王入局：大数据巨头Databricks，刚刚发布MoE大模型DBRX，并宣称：它在基准测试中击败了此前所有开源模型。包括同为混合专家模型的Grok-1和Mixtral。打开网易...

micro1年前

19710

美国朝DeepSeek打了一记重拳，斯坦福团队花146元复现AI模型

围绕中国开源 AI 公司深度求索（DeepSeek）热潮不断加剧，已成为全民热议的话题，同时也掀起一股新的AI热潮。而当前，美国企业界、学术界、政府机构纷纷开启“反击”热潮。首先是美国企业层面，...

micro1个月前

15712

加载更多

3140亿参数Grok-1推理加速3.8倍

吴恩达开源大模型套件：11个模型平台一种方式调用

智能的本质就是压缩？马毅团队5年心血提出「白盒」Transformer

清华系大模型公司扎堆，真抱团还是假情谊？

开源AI模型正在超越专有模型，LeCun大赞

北大发起 Open-Sora计划：旨在复现Sora模型

腾讯混元开放代码和算法，可免费商用

AI Agent，启动！复旦NLP团队发86页长文综述

新开源之王来了！1320亿参数，还比Llama2-70B快1倍

美国朝DeepSeek打了一记重拳，斯坦福团队花146元复现AI模型

近期文章

近期评论