micro的头像-开放智能
管理员
这家伙很懒,什么都没有写...
Runway官宣下场通用世界模型!解决视频AI最大难题-开放智能

Runway官宣下场通用世界模型!解决视频AI最大难题

Runway突然发布公告,宣称要开发通用世界模型,解决AI视频最大难题,未来要用AI模拟世界。最近AI视频赛道的Pika 1.0大火,两位华人创始人团队半年做出的产品几乎碾压了Runway接近两年的发展成果...
微调Mistral-7B实现86.81%准确率-开放智能

微调Mistral-7B实现86.81%准确率

 小模型也能解锁数学能力,无需多模型集成,7B模型在GSM 8 k数据集上性能超越70B!对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。比如之前有研究结果显示,在GSM 8K基准测...
12个月前
25013
ConsistentID,单张照片即可成为百变超人-开放智能

ConsistentID,单张照片即可成为百变超人

  上传一张个人照片就能瞬间变换身份,这不再是科幻片中的情节。最近,图像生成技术经历了显著的进化,这是由基于扩散的, 文本到图像大型模型的出现和进步驱动的,如GLIDE 、DALL-E 2 、Image...
训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解-开放智能

训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解

 北京大学和中山大学等机构研究者提出了统一的视觉语言大模型 ——Chat-UniVi。通过构建图片和视频统一表征,该框架使得一个 LLM 能够在图片和视频的混合数据下训练,并同时完成图片和视频理解...
开源版「ChatGPT Plus」来了,能做数据分析、插件调用、自动上网-开放智能

开源版「ChatGPT Plus」来了,能做数据分析、插件调用、自动上网

 来自香港大学、XLang实验室、Sea AI实验室和Salesforce的研究者联合打造了一款用于真实世界生产力工具的开源智能体框架——OpenAgents,并开源了全栈代码(完整前后端,研究代码),以满足从...
LLM生成延迟降低50%!DeepSpeed团队发布FastGen-开放智能

LLM生成延迟降低50%!DeepSpeed团队发布FastGen

DeepSpeed-FastGen结合MII和DeepSpeed-Inference实现LLM高吞吐量文本生成。GPT-4和LLaMA这样的大型语言模型(LLMs)已在各个层次上成为了集成AI 的主流服务应用。从常规聊天模型到文档摘要,从...
OpenAI首个AI视频模型炸裂登场,端掉行业饭碗!-开放智能

OpenAI首个AI视频模型炸裂登场,端掉行业饭碗!

卷疯了卷疯了,短短十几小时内,OpenAI和谷歌接连发布核弹级成果。国内还没睡的人们,经历了过山车般的疯狂一晚。就在刚刚,OpenAI突然发布首款文生视频模型——Sora。简单来说就是,AI视频要变...
微软AI程序员登场,10倍AI工程师真来了?-开放智能

微软AI程序员登场,10倍AI工程师真来了?

 全球首个AI程序员Devin诞生之后,让码农纷纷恐慌。没想到,微软同时也整出了一个AI程序员——AutoDev,能够自主生成、执行代码等任务。网友惊呼,AI编码发展太快了。全球首个AI程序员Devin的...
1年前
19313
让 Kimi Chat 学完了整本周易,给 Sam Altman 算了一卦-开放智能

让 Kimi Chat 学完了整本周易,给 Sam Altman 算了一卦

 最近,Kimi Chat 的上下文长度从 20 万汉字升级到了200 万汉字,10 倍的差距已经足够产生一次质变,做很多之前做不了的事情。感谢月之暗面给了提前测试的机会,我们直接开测!场景1:做SEO搜...
虚拟和现实世界已分不清!OpenAI首个AI视频模型-开放智能

虚拟和现实世界已分不清!OpenAI首个AI视频模型

OpenAI Sora宣传视频(00:59)“一名时尚女子走在充满霓虹灯和广告牌的标志性东京街头,她穿着黑色皮夹克、红长裙和黑靴子,拎着黑色手袋,戴着太阳镜,涂着红色口红,走路自信又随意。街道潮湿且...
1年前
15413