全球最强大模型一夜易主,GPT-4被全面超越
Anthropic刚刚官宣:Claude 3来了!作为OpenAI最强竞争选手,此次它发布的新模型家族,以最强版Claude 3 Opus为代表,“已经实现了接近人类的理解能力”——在推理、数学、编码、多语言理解和...
异军突起的视频AI,揭示了什么?
在当下的AI赛道上,AI聊天、绘画一类的应用,早已枝繁叶茂。 然而,在此类同质化应用扎堆的情况下,一类颇有技术难度,也较少被人提及的方向,正在悄然崛起。 这就是最能调动人感官的视频AI领域...
两位00后,融资8个亿
又一个AI融资神话出现。消息传来,本周AI芯片公司Etched宣布完成 1.2 亿美元(约人民币8亿元)的 A 轮融资,投资阵容再次集结了一众硅谷大佬。此次融资备受关注,在于Etched向英伟达发起了挑战宣...
Runway官宣下场通用世界模型!解决视频AI最大难题
Runway突然发布公告,宣称要开发通用世界模型,解决AI视频最大难题,未来要用AI模拟世界。最近AI视频赛道的Pika 1.0大火,两位华人创始人团队半年做出的产品几乎碾压了Runway接近两年的发展成果...
微调Mistral-7B实现86.81%准确率
小模型也能解锁数学能力,无需多模型集成,7B模型在GSM 8 k数据集上性能超越70B!对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。比如之前有研究结果显示,在GSM 8K基准测...
ConsistentID,单张照片即可成为百变超人
上传一张个人照片就能瞬间变换身份,这不再是科幻片中的情节。最近,图像生成技术经历了显著的进化,这是由基于扩散的, 文本到图像大型模型的出现和进步驱动的,如GLIDE 、DALL-E 2 、Image...
训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解
北京大学和中山大学等机构研究者提出了统一的视觉语言大模型 ——Chat-UniVi。通过构建图片和视频统一表征,该框架使得一个 LLM 能够在图片和视频的混合数据下训练,并同时完成图片和视频理解...
开源版「ChatGPT Plus」来了,能做数据分析、插件调用、自动上网
来自香港大学、XLang实验室、Sea AI实验室和Salesforce的研究者联合打造了一款用于真实世界生产力工具的开源智能体框架——OpenAgents,并开源了全栈代码(完整前后端,研究代码),以满足从...
LLM生成延迟降低50%!DeepSpeed团队发布FastGen
DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。GPT-4和LLaMA这样的大型语言模型(LLMs)已在各个层次上成为了集成AI 的主流服务应用。从常规聊天模型到文档摘要,从...
OpenAI首个AI视频模型炸裂登场,端掉行业饭碗!
卷疯了卷疯了,短短十几小时内,OpenAI和谷歌接连发布核弹级成果。国内还没睡的人们,经历了过山车般的疯狂一晚。就在刚刚,OpenAI突然发布首款文生视频模型——Sora。简单来说就是,AI视频要变...