排序
3140亿参数Grok-1推理加速3.8倍
马斯克说到做到开源Grok-1,开源社区一片狂喜。但基于Grok-1做改动or商用,都还有点难题:Grok-1使用Rust+JAX构建,对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。打开网...
韩国AI公司Upstage的LLM击败ChatGPT
据kedglobal报道,韩国AI创业公司Upstage采用Meta的LLaMA270B模型训练的最新AI模型,在HuggingFaceOpenLLMLeaderboard排行榜上获得了72.3的平均得分,位居榜首,而ChatGPT的基准分数为71.9。该...
新开源之王来了!1320亿参数,还比Llama2-70B快1倍
“最强”开源大模型之争,又有新王入局:大数据巨头Databricks,刚刚发布MoE大模型DBRX,并宣称: 它在基准测试中击败了此前所有开源模型。 包括同为混合专家模型的Grok-1和Mixtral。打开网易...
小扎砸数百亿美元猛攻开源AGI!
今天,小扎正式宣战「开源AGI」!下一代大模型Llama 3正在训练,年底将拥有35万块H100,届时算力总和达60万块H100。为了追赶OpenAI,成立十年的FAIR团队纳入GenAI,全力奔赴AGI。自Llama2、Co...
AI Agent,启动!复旦NLP团队发86页长文综述
近日,一篇探讨基于LLM的Agent综述论文在X上火了!仔细一看,论文署名中甚至一度还有米哈游。9月19日,Jim Fan转发了一篇来自复旦NLP团队对基于LLM的Agent的综述。Agent是能够感知自身所处环境...
Meta宣布Llama 3细节:真正关键的模型后训练阶段
Meta 推出了Llama 3介绍视频,有几个细节值得分享给大家Llama 3模型本体 Llama 3 训练数据(15万亿token)是Llama 2的7倍,微调数据(1000条万人类标注)是Ll...
英特尔推出34款开源AI套件 开发人员有望走上“快车道”!
根据科技巨头英特尔公司周一(7月24日)的一份公告,其与咨询公司埃森哲合作推出了34款开源人工智能(AI)参考套件,这些参考套件旨在简化和加快数据科学家和开发人员部署AI的过程。打开网易新...
GPT-4顶替老板&程序员,这个GitHub项目火上热搜第一
让GPT-4运转一个软件公司,就能把项目成本砍到几美元?这个想法,还真有人在做了——就在这两天,一个名叫MetaGPT的项目在GitHub上爆火,一度冲上热榜第一,目前标星已有6.6k。打开网易新闻 查...
Llama3,凭什么价值百亿美金?
4月19日,Facebook母公司Meta重磅推出了Llama3。即便大家现在对于大厂和巨头频繁迭代AI模型的行为已经见怪不怪,Meta的Llama3仍旧显得与众不同,因为这是迄今最强大的开源AI模型。Meta推出了重...
新越狱方法让Stable Diffusion和DALL·E 2忽略安全规则
Stable Diffusion 是 公司的一款文生图大模型,DALL·E 2 则是 公司的一款文生图大模型。近日,一组研究人员让这两款大模型能够做到无视已被设定好的安全规则,创建出包含裸体、肢解尸体、暴力...