排序
当前大模型技术超全总结!
本文分为三个章节,深入浅出地解读大模型的技术,具体如下三个部分:1、GPT、LLaMA、ChatGLM、Falcon等大语言模型的技术细节比较在深入研究LLaMA、ChatGLM和Falcon等大语言模型时,我们不难发现...
智谱大模型,有了首个免费的API
最近一段时间,国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上,新发布的 Gemini 1.5 大模型序列中出现了 Flash 版,主打轻量化和响应速度。到 7 月,OpenAI 又在 GPT-4o 的基础上推...
腾讯混元开放代码和算法,可免费商用
随着AIGC的逐渐普及,你有没有发现越来越多的人开始用大模型自制微信头像?不过,许多文生图大模型仍然存在诸多不足,例如质感不强、图像畸变等。而今,秉持着实用研发思路的腾讯混元文生图大...
DALL·E 3瞬间生成素材,零成本制作数千万流水游戏
OpenAI总裁Brockman又给网友支招来薅ChatGPT Plus的羊毛了。直接用DALL·E 3可以快速生成制作2D游戏的各种素材,像素风,JRPG都不在话下! OpenAI总裁Brockman最近转发了一条推特火了,全网超过...
SearchGPT第一波评测来了!响应速度超快还没广告
OpenAI这次终于不放卫星了——最新发布的SearchGPT,已经有第一波尝鲜者展示了自己的体验。打开网易新闻 查看更多图片 据做测试的博主介绍,SearchGPT的响应和输出速度都突出一个“快”。 打...
开发速率飙升20倍!从0开始构建AI
开发者的效率倍增工具来了。AI开发者伴侣GPT Pilot可以让95%的开发者实现自动编码。又一个明星项目诞生了!GPT Pilot,一个AI开发者伴侣,可以从0开始构建应用程序,可以自己编写代码、配置开发...
如何从头开始编写LoRA代码,这有一份教程
LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大语言模型)的流行技术,最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其他技...
英伟达最强通用大模型Nemotron-4登场
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8T token上完成了训练...
SQL+向量驱动大模型和大数据新范式,MyScale开源
大模型(LLM)的浪潮已经涌动一年多了,尤其是以 GPT-4、Gemini-1.5、Claude-3 等为代表的模型你方唱罢我登场,成为当之无愧的风口。在 LLM 这条赛道上,有的研究专注于增加模型参数,有的疯...
让 Kimi Chat 学完了整本周易,给 Sam Altman 算了一卦
最近,Kimi Chat 的上下文长度从 20 万汉字升级到了200 万汉字,10 倍的差距已经足够产生一次质变,做很多之前做不了的事情。感谢月之暗面给了提前测试的机会,我们直接开测!场景1:做SEO搜...