排序
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!
极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
推理性能超H100十倍!21岁华裔小哥哈佛辍学开发AI加速芯片
最近,两位哈佛辍学生共同创立的AI芯片公司,估值已达3400万美元,并计划明年交付一款名为「Sohu」的AI推理加速芯片——其LLM推理性能达到H100的10倍,而单价吞吐量更是高达140倍。像Pika一样...
Mamba架构第一次做大!混合Transformer,打败Transformer
精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
揭秘HuggingFace规模最大、质量最高预训练数据集
从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训练提供更优质的性能。大型语言模型(LLMs)的性能在很大程度上取决于它的...
Meta带来Transformer新突破:结束人工智能推理能力「黑核化」?
Transformer架构在生成式人工智能诸多领域展现出非凡的能力:GPT3,GPT3.5,GPT4,sora, Llama2 ,Gemini,通义千问,文心一言等等全部建立在Transformer上。然而,在解决复杂的规划与推理任...
OpenAI、Meta将推出拥有“推理”功能的AI
大型科技公司正忙着升级自家的大型语言模型。据报道,OpenAI和Meta即将发布各自的新版人工智能(AI)模型,他们声称这些模型将能够进行推理和规划,这是在机器中实现超人认知的关键步骤。本周,...
AI Agent当牛做马,办公自动化带来超级生产力
成立仅9个月的AI初创公司拉普拉斯智能(Laplace AI),已经用原生智能生产力操作平台帮助企业用户实现智能体落地了!平台名为拉普拉斯智能实验室(Laplace AI Lab),入口统一,用自然语言即...
英伟达成立最壕AI实验室:Jim Fan领衔,专攻具身智能
英伟达最新大动作来了——通用具身智能体。打开网易新闻 查看更多图片 这则消息是由英伟达高级科学家Jim Fan透露,他表示: 我将和老队友Yuke Zhu一起,在英伟达内部组建一个新研究小组——GEA...
六大顶尖高校联手发布全新Gen4Gen框架
文中提出了一个半自动数据集创建管道Gen4Gen,将个性化概念与文本描述结合成复杂的组合,创建了基准测试数据集MyCanvas,利用CP-CLIP 和 TI-CLIP指标证明了该方法的有效性。过去几年里,基于...
首个国产全功能GPU的万卡集群来了!“中国英伟达”
纯国产GPU的万卡集群,它来了!而且还是国内首个全功能GPU,兼容CUDA的那种。 打开网易新闻 查看更多图片 这个集结了超过10000张高性能GPU的超复杂工程,它的算力有多大?不卖关子,直接揭...