天工大模型3.0将于4月17日发布,并将同步开源
日前昆仑万维方面宣布,天工大模型3.0将于4月17日、即天工大模型发布一周年之际开启公测,并将同步开源。据了解,天工3.0采用4千亿级参数MoE混合专家模型,号称是全球模型参数最大、性能最强...
BT看AI!资深基因从业者评测国内外26个大模型
最近微信改版,容易找不到尹哥的文章,大家记得把尹哥设为星标⭐️ 哦~在人工智能的历史长河中,GPT-4无疑是一座里程碑,它不仅代表了OpenAI在自然语言处理领域的深厚积累,更是全球AI技术发...
首个AI游戏引擎或颠覆任天堂/暴雪?0代码即可创建
还有什么领域没有被AI渗透?继音乐之后,首个AI游戏引擎已经完全凭几个字,就能创建游戏资产和动画了。老黄预测,未来5-10年我们将看到完全由AI生成的游戏。「未来5-10年,我们可以看到完全由...
Runway官宣下场通用世界模型!解决视频AI最大难题
Runway突然发布公告,宣称要开发通用世界模型,解决AI视频最大难题,未来要用AI模拟世界。最近AI视频赛道的Pika 1.0大火,两位华人创始人团队半年做出的产品几乎碾压了Runway接近两年的发展成果...
微调Mistral-7B实现86.81%准确率
小模型也能解锁数学能力,无需多模型集成,7B模型在GSM 8 k数据集上性能超越70B!对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。比如之前有研究结果显示,在GSM 8K基准测...
ConsistentID,单张照片即可成为百变超人
上传一张个人照片就能瞬间变换身份,这不再是科幻片中的情节。最近,图像生成技术经历了显著的进化,这是由基于扩散的, 文本到图像大型模型的出现和进步驱动的,如GLIDE 、DALL-E 2 、Image...
如何从头开始编写LoRA代码,这有一份教程
LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大语言模型)的流行技术,最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其他技...
Midjourney V6超进化
Midjourney大神的超深度测评来了!V6比起V5.2究竟有哪些改进?来感受一下吧。最近,国外的一位名叫Andrei Kovalev的大神网友,做出了一份Midjourney V6的超深度评测。指南很专业,V6和V5.2有...
当前大模型技术超全总结!
本文分为三个章节,深入浅出地解读大模型的技术,具体如下三个部分:1、GPT、LLaMA、ChatGLM、Falcon等大语言模型的技术细节比较在深入研究LLaMA、ChatGLM和Falcon等大语言模型时,我们不难发现...
直追GPT-3.5,“欧洲版OpenAI”推出新模型
12月初,法国AI初创公司Mistral AI已正式结束其备受期待的A轮融资。据彭博社报道,公司已筹集了3.85亿欧元(约4.15亿美元),该公司的估值约为20亿美元。Mistral AI今天也开放了其商业平台。1...