开源 第5页
天工大模型3.0将于4月17日发布,并将同步开源-开放智能

天工大模型3.0将于4月17日发布,并将同步开源

 日前昆仑万维方面宣布,天工大模型3.0将于4月17日、即天工大模型发布一周年之际开启公测,并将同步开源。据了解,天工3.0采用4千亿级参数MoE混合专家模型,号称是全球模型参数最大、性能最强...
micro的头像-开放智能micro1年前
25413
DeepSeek满血微调秘籍来了-开放智能

DeepSeek满血微调秘籍来了

 全网首发!DeepSeek V3/R1满血版低成本监督微调秘籍来了,让高达6710亿参数AI巨兽释放最强性能。DeepSeek V3/ R1火爆全网,基于原始模型的解决方案和API服务已随处可见,陷入低价和免费内卷。...
micro的头像-开放智能micro1个月前
24856
为ChatGPT添加记忆、反思能力等,斯坦福爆火项目开源啦!-开放智能

为ChatGPT添加记忆、反思能力等,斯坦福爆火项目开源啦!

Generative Agents详细介绍早在今年4月,斯坦福曾发表一篇名为《Generative Agents: Interactive Simulacra of Human Behavior》的论文,主要展示了为ChatGPT(GPT-3.5-turbo版本)添加记忆、规...
innov的头像-开放智能innov2年前
18114
开发速率飙升20倍!从0开始构建AI-开放智能

开发速率飙升20倍!从0开始构建AI

开发者的效率倍增工具来了。AI开发者伴侣GPT Pilot可以让95%的开发者实现自动编码。又一个明星项目诞生了!GPT Pilot,一个AI开发者伴侣,可以从0开始构建应用程序,可以自己编写代码、配置开发...
micro的头像-开放智能micro1年前
2076
LLM上下文窗口突破200万!无需架构变化+复杂微调-开放智能

LLM上下文窗口突破200万!无需架构变化+复杂微调

 LongRoPE方法首次将LLM的窗口扩展到了2048k个token,只是简单微调的情况下,就能实现与短上下文窗口相近的性能!大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文...
micro的头像-开放智能micro12个月前
2176
马斯克版ChatGPT背后开发工具上线!xAI产品两连发-开放智能

马斯克版ChatGPT背后开发工具上线!xAI产品两连发

马斯克版ChatGPT才刚吸引一波眼球,xAI第二款大模型产品就突然登场了!就在刚刚,马斯克旗下xAI官宣:推出PromptIDE。 一个用于提示工程和可解释性研究的集成开发环境。 打开网易新闻 查看更...
micro的头像-开放智能micro2年前
18110
阿里又在AI上大出血了-开放智能

阿里又在AI上大出血了

阿里在AI上下足了血本。近日,中国AI大模型初创公司MiniMax正在进行新一轮大规模融资,阿里是其中的核心领投方,融资金额尚未披露。MiniMax成立于2021年,同时拥有文本、语音、视觉三模态融合的...
micro的头像-开放智能micro1年前
26011
Meta 发布全球最大开源模型Llama 3.1 405B-开放智能

Meta 发布全球最大开源模型Llama 3.1 405B

 要点总结:  最大的模型 Llama 3.1 405B 也会开源。马克·扎克伯格发布公开信,详细了解开源为何对开发者、对 Meta 和对世界都有好处。  最新模型将上下文长度扩展到 128K、增加了对八种...
micro的头像-开放智能micro9个月前
1578
秒杀700亿Llama 2!最新国产大模型亮相-开放智能

秒杀700亿Llama 2!最新国产大模型亮相

 国产大模型刚刚出了一位全新选手:参数670亿的DeepSeek。它在近20个中英文的公开评测榜单上直接超越了同量级、700亿的Llama 2。并尤其以推理、数学和编码能力为突出。打开网易新闻 查看更多图...
micro的头像-开放智能micro2年前
19710
开源版AI程序员来了:GPT-4加持,能力比肩Devin-开放智能

开源版AI程序员来了:GPT-4加持,能力比肩Devin

 最近,有很多人在为 AI 代替自己的工作而担忧。上个月火遍 AI 圈的「首位 AI 程序员」Devin,利用大模型能力已经掌握了全栈技能,仅需要人类给出自然语言指令,就可以自动完成复杂的代码任务...
micro的头像-开放智能micro1年前
1927