模型-开放智能-第8页

更新

浏览

千元预算半天训练，效果媲美主流大模型，开源可商用中文LLaMA-2

LLaMA-2 相较于 LLaMA-1，引入了更多且高质量的语料，实现了显著的性能提升，全面允许商用，进一步激发了开源社区的繁荣，拓展了大型模型的应用想象空间。然而，从头预训练大模型的成本相当高，...

innov1年前

011115

OpenAI神秘Q毁灭人类？爆火「Q假说」

传闻中OpenAI的Q*，已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文，猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI，已是临门一脚了...

micro11个月前

01187

推理性能超H100十倍！21岁华裔小哥哈佛辍学开发AI加速芯片

最近，两位哈佛辍学生共同创立的AI芯片公司，估值已达3400万美元，并计划明年交付一款名为「Sohu」的AI推理加速芯片——其LLM推理性能达到H100的10倍，而单价吞吐量更是高达140倍。像Pika一样...

micro10个月前

05811

英伟达最强通用大模型Nemotron-4登场

许久未更新大模型的英伟达推出了150亿参数的Nemotron-4，目标是打造一个能在单个A100/H100可跑的通用大模型。最近，英伟达团队推出了全新的模型Nemotron-4，150亿参数，在8T token上完成了训练...

micro6个月前

015213

新开源之王来了！1320亿参数，还比Llama2-70B快1倍

“最强”开源大模型之争，又有新王入局：大数据巨头Databricks，刚刚发布MoE大模型DBRX，并宣称：它在基准测试中击败了此前所有开源模型。包括同为混合专家模型的Grok-1和Mixtral。打开网易...

micro6个月前

017810

微调Mistral-7B实现86.81%准确率

小模型也能解锁数学能力，无需多模型集成，7B模型在GSM 8 k数据集上性能超越70B！对于小型语言模型（SLM）来说，数学应用题求解是一项很复杂的任务。比如之前有研究结果显示，在GSM 8K基准测...

micro5个月前

017613

OpenAI新模型「草莓」曝光：强推理/长任务规划

OpenAI最新绝密项目曝光！知情人士透露，OpenAI正在开发一个名为“草莓（Strawberry）”的新模型，它的前身是Q*。其工作机制在内部被严格保密，且细节从未被外界报道过。消息称，“草莓”模型不...

micro2个月前

01445

讯飞星火大模型升级3.0，刘庆峰：完全基于国产算力平台

·据科大讯飞董事长刘庆峰透露，在基础算力平台方面，目前讯飞星火大模型V3.0完全基于国产算力平台，将来大模型的4.0版本也将完全基于华为支持的算力平台。·刘庆峰对近日科大讯飞被曝学习机中...

micro12个月前

0549

AI视觉字谜爆火！梦露秒变爱因斯坦，英伟达AI科学家：近期最酷

AI画的玛丽莲·梦露，倒转180°后，竟然变成了爱因斯坦？！打开网易新闻查看更多图片这是最近在社交媒体上爆火的扩散模型视错觉画，随便给AI两组不同的提示词，它都能给你画出来！哪怕是...

micro10个月前

0807

深挖RLHF，复旦语言和视觉团队创新奖励模型优化，让大模型更对齐

打开网易新闻查看更多图片继第一份大模型对齐技术报告（Secrets of RLHF in Large Language Models Part I）获 NeurIPS 2023 workshop best paper 后，第二份报告强势归来，复旦语言和视觉...

micro8个月前

0745

加载更多