经验共221篇 第6页
开源AI模型正在超越专有模型,LeCun大赞-开放智能

开源AI模型正在超越专有模型,LeCun大赞

 最近,这张号称「或许是2024年最重要的AI图之一」的图开始热转,可以看到,开源本地模型,已经取代了大规模、基于云的昂贵封闭模型,这种转变令人兴奋、着迷。最近,这张图开始在AI社区热转,...
micro的头像-开放智能micro10个月前
06013
微软AI程序员登场,10倍AI工程师真来了?-开放智能

微软AI程序员登场,10倍AI工程师真来了?

 全球首个AI程序员Devin诞生之后,让码农纷纷恐慌。没想到,微软同时也整出了一个AI程序员——AutoDev,能够自主生成、执行代码等任务。网友惊呼,AI编码发展太快了。全球首个AI程序员Devin的...
micro的头像-开放智能micro6个月前
013513
让 Kimi Chat 学完了整本周易,给 Sam Altman 算了一卦-开放智能

让 Kimi Chat 学完了整本周易,给 Sam Altman 算了一卦

 最近,Kimi Chat 的上下文长度从 20 万汉字升级到了200 万汉字,10 倍的差距已经足够产生一次质变,做很多之前做不了的事情。感谢月之暗面给了提前测试的机会,我们直接开测!场景1:做SEO搜...
micro的头像-开放智能micro6个月前
013013
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!-开放智能

港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!

 极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
micro的头像-开放智能micro3个月前
016813
智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer-开放智能

智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer

来自UC伯克利,港大等机构的研究人员,开创性地提出了一种「白盒」Transformer结构——CRATE。他们通过将数据从高维度分布压缩到低维结构分布,实现有效的表征,从而进一步实现了有竞争力的模型...
micro的头像-开放智能micro11个月前
06613
OpenAI首个AI视频模型炸裂登场,端掉行业饭碗!-开放智能

OpenAI首个AI视频模型炸裂登场,端掉行业饭碗!

卷疯了卷疯了,短短十几小时内,OpenAI和谷歌接连发布核弹级成果。国内还没睡的人们,经历了过山车般的疯狂一晚。就在刚刚,OpenAI突然发布首款文生视频模型——Sora。简单来说就是,AI视频要变...
micro的头像-开放智能micro7个月前
017813
前谷歌科学家离职创业1年,自述训练LLM卡在算力上!-开放智能

前谷歌科学家离职创业1年,自述训练LLM卡在算力上!

前谷歌大脑科学家Yi Tay去年3月离职后,创办了一家初创公司。创业一年,他发文表示「痛并快乐着」。 在这篇博文中,我讨论了: 1. 在不同计算提供商中采购计算和差异的经验。我们最大的发现/惊...
micro的头像-开放智能micro6个月前
06613
虚拟和现实世界已分不清!OpenAI首个AI视频模型-开放智能

虚拟和现实世界已分不清!OpenAI首个AI视频模型

OpenAI Sora宣传视频(00:59)“一名时尚女子走在充满霓虹灯和广告牌的标志性东京街头,她穿着黑色皮夹克、红长裙和黑靴子,拎着黑色手袋,戴着太阳镜,涂着红色口红,走路自信又随意。街道潮湿且...
micro的头像-开放智能micro7个月前
013513
LLM生成延迟降低50%!DeepSpeed团队发布FastGen-开放智能

LLM生成延迟降低50%!DeepSpeed团队发布FastGen

DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。GPT-4和LLaMA这样的大型语言模型(LLMs)已在各个层次上成为了集成AI 的主流服务应用。从常规聊天模型到文档摘要,从...
micro的头像-开放智能micro10个月前
07313
英伟达最强通用大模型Nemotron-4登场-开放智能

英伟达最强通用大模型Nemotron-4登场

许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8T token上完成了训练...
micro的头像-开放智能micro6个月前
015213