排序
训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解
北京大学和中山大学等机构研究者提出了统一的视觉语言大模型 ——Chat-UniVi。通过构建图片和视频统一表征,该框架使得一个 LLM 能够在图片和视频的混合数据下训练,并同时完成图片和视频理解...
Runway官宣下场通用世界模型!解决视频AI最大难题
Runway突然发布公告,宣称要开发通用世界模型,解决AI视频最大难题,未来要用AI模拟世界。最近AI视频赛道的Pika 1.0大火,两位华人创始人团队半年做出的产品几乎碾压了Runway接近两年的发展成果...
英伟达最强通用大模型Nemotron-4登场
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8T token上完成了训练...
大模型只有免费了才能迎来应用大爆发|昆仑万维方汉
“只有免费模式,才能让所有用户享受到服务,才能迎来真正的应用大爆发。”在MEET 2024智能未来大会现场,昆仑万维董事长兼CEO方汉在分享“大模型将如何介入普通人生活”时,作出了如上发言。昆...
ConsistentID,单张照片即可成为百变超人
上传一张个人照片就能瞬间变换身份,这不再是科幻片中的情节。最近,图像生成技术经历了显著的进化,这是由基于扩散的, 文本到图像大型模型的出现和进步驱动的,如GLIDE 、DALL-E 2 、Image...
LLM生成延迟降低50%!DeepSpeed团队发布FastGen
DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。GPT-4和LLaMA这样的大型语言模型(LLMs)已在各个层次上成为了集成AI 的主流服务应用。从常规聊天模型到文档摘要,从...
当前大模型技术超全总结!
本文分为三个章节,深入浅出地解读大模型的技术,具体如下三个部分:1、GPT、LLaMA、ChatGLM、Falcon等大语言模型的技术细节比较在深入研究LLaMA、ChatGLM和Falcon等大语言模型时,我们不难发现...
通过腾讯云免费访问ChatGPT,跟科学上网说拜拜吧!
前言 目前在国内无法直接访问ChatGPT,只能通过科学上网的方式进行访问,且由于最近OpenAI查的比较严格,账号被封的可能性极大,所以换个思路,可以在国内也稳定使用ChatGPT。 腾讯云-云函数 通...
Meta带来Transformer新突破:结束人工智能推理能力「黑核化」?
Transformer架构在生成式人工智能诸多领域展现出非凡的能力:GPT3,GPT3.5,GPT4,sora, Llama2 ,Gemini,通义千问,文心一言等等全部建立在Transformer上。然而,在解决复杂的规划与推理任...
百川智能王小川:明年国内会诞生若干大模型超级应用
10月31日,百川智能创始人兼CEO王小川在2023云栖大会上发表演讲,他称,今年年底之前,国内会有几家公司能够做到GPT3.5的水平,明年国内会有若干款超级应用。打开网易新闻 查看更多图片 百川...