排序
大模型只有免费了才能迎来应用大爆发|昆仑万维方汉
“只有免费模式,才能让所有用户享受到服务,才能迎来真正的应用大爆发。”在MEET 2024智能未来大会现场,昆仑万维董事长兼CEO方汉在分享“大模型将如何介入普通人生活”时,作出了如上发言。昆...
首个AI游戏引擎或颠覆任天堂/暴雪?0代码即可创建
还有什么领域没有被AI渗透?继音乐之后,首个AI游戏引擎已经完全凭几个字,就能创建游戏资产和动画了。老黄预测,未来5-10年我们将看到完全由AI生成的游戏。「未来5-10年,我们可以看到完全由...
ConsistentID,单张照片即可成为百变超人
上传一张个人照片就能瞬间变换身份,这不再是科幻片中的情节。最近,图像生成技术经历了显著的进化,这是由基于扩散的, 文本到图像大型模型的出现和进步驱动的,如GLIDE 、DALL-E 2 、Image...
能读图会识物,基于通义千问7B打造,可商用
阿里开源大模型,又上新了~继通义千问-7B(Qwen-7B)之后,阿里云又推出了大规模视觉语言模型Qwen-VL,并且一上线就直接开源。打开网易新闻 查看更多图片 具体来说,Qwen-VL是基于通义千问-7B打...
2亿参数时序模型替代LLM?谷歌突破性研究被批
最近,谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。这篇论文的标题是「A decoder-only foundation model for time-series forecasting(用于时间序列预测的仅解码器基础模型)」。打...
开源AI模型正在超越专有模型,LeCun大赞
最近,这张号称「或许是2024年最重要的AI图之一」的图开始热转,可以看到,开源本地模型,已经取代了大规模、基于云的昂贵封闭模型,这种转变令人兴奋、着迷。最近,这张图开始在AI社区热转,...
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!
极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
英伟达最强通用大模型Nemotron-4登场
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8T token上完成了训练...
微调Mistral-7B实现86.81%准确率
小模型也能解锁数学能力,无需多模型集成,7B模型在GSM 8 k数据集上性能超越70B!对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。比如之前有研究结果显示,在GSM 8K基准测...
谷歌提出基于AI反馈的强化学习
与基于人类反馈的强化学习(RLHF)相媲美的技术,出现了。近日,Google Research 的研究人员提出了基于 AI 反馈的强化学习(RLAIF),该技术可以产生人类水平的性能,为解决基于人类反馈的强化...