开源共84篇 第2页
英伟达,突然开源!-开放智能

英伟达,突然开源!

当地时间6月14日,英伟达开源Nemotron-4 340B(3400亿参数)系列模型。打开网易新闻 查看更多图片 据英伟达介绍,开发人员可使用该系列模型生成合成数据,用于训练大型语言模型(LLM),用于医疗...
micro的头像-开放智能micro3个月前
023414
为ChatGPT添加记忆、反思能力等,斯坦福爆火项目开源啦!-开放智能

为ChatGPT添加记忆、反思能力等,斯坦福爆火项目开源啦!

Generative Agents详细介绍早在今年4月,斯坦福曾发表一篇名为《Generative Agents: Interactive Simulacra of Human Behavior》的论文,主要展示了为ChatGPT(GPT-3.5-turbo版本)添加记忆、规...
innov的头像-开放智能innov1年前
012914
微软AI程序员登场,10倍AI工程师真来了?-开放智能

微软AI程序员登场,10倍AI工程师真来了?

 全球首个AI程序员Devin诞生之后,让码农纷纷恐慌。没想到,微软同时也整出了一个AI程序员——AutoDev,能够自主生成、执行代码等任务。网友惊呼,AI编码发展太快了。全球首个AI程序员Devin的...
micro的头像-开放智能micro6个月前
013513
虚拟和现实世界已分不清!OpenAI首个AI视频模型-开放智能

虚拟和现实世界已分不清!OpenAI首个AI视频模型

OpenAI Sora宣传视频(00:59)“一名时尚女子走在充满霓虹灯和广告牌的标志性东京街头,她穿着黑色皮夹克、红长裙和黑靴子,拎着黑色手袋,戴着太阳镜,涂着红色口红,走路自信又随意。街道潮湿且...
micro的头像-开放智能micro7个月前
013513
智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer-开放智能

智能的本质就是压缩?马毅团队5年心血提出「白盒」Transformer

来自UC伯克利,港大等机构的研究人员,开创性地提出了一种「白盒」Transformer结构——CRATE。他们通过将数据从高维度分布压缩到低维结构分布,实现有效的表征,从而进一步实现了有竞争力的模型...
micro的头像-开放智能micro11个月前
06613
开源AI模型正在超越专有模型,LeCun大赞-开放智能

开源AI模型正在超越专有模型,LeCun大赞

 最近,这张号称「或许是2024年最重要的AI图之一」的图开始热转,可以看到,开源本地模型,已经取代了大规模、基于云的昂贵封闭模型,这种转变令人兴奋、着迷。最近,这张图开始在AI社区热转,...
micro的头像-开放智能micro10个月前
06013
训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解-开放智能

训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解

 北京大学和中山大学等机构研究者提出了统一的视觉语言大模型 ——Chat-UniVi。通过构建图片和视频统一表征,该框架使得一个 LLM 能够在图片和视频的混合数据下训练,并同时完成图片和视频理解...
micro的头像-开放智能micro10个月前
011413
前谷歌科学家离职创业1年,自述训练LLM卡在算力上!-开放智能

前谷歌科学家离职创业1年,自述训练LLM卡在算力上!

前谷歌大脑科学家Yi Tay去年3月离职后,创办了一家初创公司。创业一年,他发文表示「痛并快乐着」。 在这篇博文中,我讨论了: 1. 在不同计算提供商中采购计算和差异的经验。我们最大的发现/惊...
micro的头像-开放智能micro6个月前
06613
LLM生成延迟降低50%!DeepSpeed团队发布FastGen-开放智能

LLM生成延迟降低50%!DeepSpeed团队发布FastGen

DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。GPT-4和LLaMA这样的大型语言模型(LLMs)已在各个层次上成为了集成AI 的主流服务应用。从常规聊天模型到文档摘要,从...
micro的头像-开放智能micro10个月前
07313
天工大模型3.0将于4月17日发布,并将同步开源-开放智能

天工大模型3.0将于4月17日发布,并将同步开源

 日前昆仑万维方面宣布,天工大模型3.0将于4月17日、即天工大模型发布一周年之际开启公测,并将同步开源。据了解,天工3.0采用4千亿级参数MoE混合专家模型,号称是全球模型参数最大、性能最强...
micro的头像-开放智能micro5个月前
018513