排序
AI视觉字谜爆火!梦露秒变爱因斯坦,英伟达AI科学家:近期最酷
AI画的玛丽莲·梦露,倒转180°后,竟然变成了爱因斯坦?! 打开网易新闻 查看更多图片 这是最近在社交媒体上爆火的扩散模型视错觉画,随便给AI两组不同的提示词,它都能给你画出来!哪怕是...
ControlNet作者又出新作:百万数据训练,AI图像生成迎来图层设计
尽管用于生成图像的大模型已经成为计算机视觉和图形学的基础,但令人惊讶的是,分层内容生成或透明图像(是指图像的某些部分是透明的,允许背景或者其他图层的图像通过这些透明部分显示出来)...
讯飞星火大模型升级3.0,刘庆峰:完全基于国产算力平台
·据科大讯飞董事长刘庆峰透露,在基础算力平台方面,目前讯飞星火大模型V3.0完全基于国产算力平台,将来大模型的4.0版本也将完全基于华为支持的算力平台。·刘庆峰对近日科大讯飞被曝学习机中...
谷歌发布新大语言模型:零样本生成10秒视频达SOTA!
你敢信?大熊猫都会打牌了! 打开网易新闻 查看更多图片 看这毛茸茸的脑袋、抓牌的动作……而这其实都是AI生成的,还是零样本那种。这就是谷歌最新大语言模型VideoPoet。它不仅没有用视频领...
腾讯混元开放代码和算法,可免费商用
随着AIGC的逐渐普及,你有没有发现越来越多的人开始用大模型自制微信头像?不过,许多文生图大模型仍然存在诸多不足,例如质感不强、图像畸变等。而今,秉持着实用研发思路的腾讯混元文生图大...
OpenAI救了Stable Diffusion!开源Dall·E3同款解码器
没想到,OpenAI捞了“竞对”Stable Diffusion一把。在热火朝天的“AI春晚”上,OpenAI一口气开源两项工作,其中之一一致性解码器,专门面向SD的VAE模型。它能让图像生成质量更高、更稳定,比如...
媲美GPT-4的开源模型泄露!Mistral老板刚刚证实
Mistral-Medium竟然意外泄露?此前仅能通过API获得,性能直逼GPT-4。CEO最新发声:确有其事,系早期客户员工泄露。但仍表示敬请期待。打开网易新闻 查看更多图片 换句话说,这个版本尚且还是旧...
异军突起的视频AI,揭示了什么?
在当下的AI赛道上,AI聊天、绘画一类的应用,早已枝繁叶茂。 然而,在此类同质化应用扎堆的情况下,一类颇有技术难度,也较少被人提及的方向,正在悄然崛起。 这就是最能调动人感官的视频AI领域...
文字序顺不响影GPT-4阅读理解,别的大模型都不行
研表究明,汉字序顺并不定一影阅响读(对于英文来说,则是每一个单词中的字母顺序)。现在,日本东京大学的一项实验发现,这个“定理”居然也适合GPT-4。比如面对这样一段“鬼画符”,几乎里面...
最新模型MVDiffusion++:无需相机姿态,即可实现高清3D模型重建
受人类视觉系统的启发,MVDiffusion++结合计算方法高保真和人类视觉系统灵活性,可以根据任意数量的无位姿图片, 生成密集、高分辨率的有位姿图像,实现了高质量的3D模型重建。人类的视觉展现...