模型共221篇 第8页
千元预算半天训练,效果媲美主流大模型,开源可商用中文LLaMA-2-开放智能

千元预算半天训练,效果媲美主流大模型,开源可商用中文LLaMA-2

LLaMA-2 相较于 LLaMA-1,引入了更多且高质量的语料,实现了显著的性能提升,全面允许商用,进一步激发了开源社区的繁荣,拓展了大型模型的应用想象空间。然而,从头预训练大模型的成本相当高,...
innov的头像-开放智能innov1年前
011115
OpenAI神秘Q*毁灭人类?爆火「Q*假说」-开放智能

OpenAI神秘Q*毁灭人类?爆火「Q*假说」

传闻中OpenAI的Q*,已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文,猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI,已是临门一脚了...
micro的头像-开放智能micro11个月前
01187
推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片-开放智能

推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片

 最近,两位哈佛辍学生共同创立的AI芯片公司,估值已达3400万美元,并计划明年交付一款名为「Sohu」的AI推理加速芯片——其LLM推理性能达到H100的10倍,而单价吞吐量更是高达140倍。像Pika一样...
micro的头像-开放智能micro10个月前
05811
英伟达最强通用大模型Nemotron-4登场-开放智能

英伟达最强通用大模型Nemotron-4登场

许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8T token上完成了训练...
micro的头像-开放智能micro6个月前
015213
新开源之王来了!1320亿参数,还比Llama2-70B快1倍-开放智能

新开源之王来了!1320亿参数,还比Llama2-70B快1倍

“最强”开源大模型之争,又有新王入局:大数据巨头Databricks,刚刚发布MoE大模型DBRX,并宣称: 它在基准测试中击败了此前所有开源模型。 包括同为混合专家模型的Grok-1和Mixtral。打开网易...
micro的头像-开放智能micro6个月前
017810
微调Mistral-7B实现86.81%准确率-开放智能

微调Mistral-7B实现86.81%准确率

 小模型也能解锁数学能力,无需多模型集成,7B模型在GSM 8 k数据集上性能超越70B!对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。比如之前有研究结果显示,在GSM 8K基准测...
micro的头像-开放智能micro5个月前
017613
OpenAI新模型「草莓」曝光:强推理/长任务规划-开放智能

OpenAI新模型「草莓」曝光:强推理/长任务规划

OpenAI最新绝密项目曝光!知情人士透露,OpenAI正在开发一个名为“草莓(Strawberry)”的新模型,它的前身是Q*。其工作机制在内部被严格保密,且细节从未被外界报道过。消息称,“草莓”模型不...
micro的头像-开放智能micro2个月前
01445
讯飞星火大模型升级3.0,刘庆峰:完全基于国产算力平台-开放智能

讯飞星火大模型升级3.0,刘庆峰:完全基于国产算力平台

·据科大讯飞董事长刘庆峰透露,在基础算力平台方面,目前讯飞星火大模型V3.0完全基于国产算力平台,将来大模型的4.0版本也将完全基于华为支持的算力平台。·刘庆峰对近日科大讯飞被曝学习机中...
micro的头像-开放智能micro12个月前
0549
AI视觉字谜爆火!梦露秒变爱因斯坦,英伟达AI科学家:近期最酷-开放智能

AI视觉字谜爆火!梦露秒变爱因斯坦,英伟达AI科学家:近期最酷

AI画的玛丽莲·梦露,倒转180°后,竟然变成了爱因斯坦?!  打开网易新闻 查看更多图片 这是最近在社交媒体上爆火的扩散模型视错觉画,随便给AI两组不同的提示词,它都能给你画出来!哪怕是...
micro的头像-开放智能micro10个月前
0807
深挖RLHF,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐-开放智能

深挖RLHF,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐

 打开网易新闻 查看更多图片 继第一份大模型对齐技术报告(Secrets of RLHF in Large Language Models Part I)获 NeurIPS 2023 workshop best paper 后,第二份报告强势归来,复旦语言和视觉...
micro的头像-开放智能micro8个月前
0745