经验共221篇 第7页
LLM上下文窗口突破200万!无需架构变化+复杂微调-开放智能

LLM上下文窗口突破200万!无需架构变化+复杂微调

 LongRoPE方法首次将LLM的窗口扩展到了2048k个token,只是简单微调的情况下,就能实现与短上下文窗口相近的性能!大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文...
micro的头像-开放智能micro5个月前
01636
开源版AI程序员来了:GPT-4加持,能力比肩Devin-开放智能

开源版AI程序员来了:GPT-4加持,能力比肩Devin

 最近,有很多人在为 AI 代替自己的工作而担忧。上个月火遍 AI 圈的「首位 AI 程序员」Devin,利用大模型能力已经掌握了全栈技能,仅需要人类给出自然语言指令,就可以自动完成复杂的代码任务...
micro的头像-开放智能micro5个月前
01637
Llama3,凭什么价值百亿美金?-开放智能

Llama3,凭什么价值百亿美金?

4月19日,Facebook母公司Meta重磅推出了Llama3。即便大家现在对于大厂和巨头频繁迭代AI模型的行为已经见怪不怪,Meta的Llama3仍旧显得与众不同,因为这是迄今最强大的开源AI模型。Meta推出了重...
micro的头像-开放智能micro5个月前
01639
拜登召集奥特曼和李飞飞等入AI安全委员会-开放智能

拜登召集奥特曼和李飞飞等入AI安全委员会

 美国总统拜登最近成立了一个新的人工智能安全委员会,目的是解决人工智能技术可能对电网、机场等关键基础设施带来的潜在威胁。国土安全部部长Alejandro Mayorkas是委员会的主席,他强调:“如...
micro的头像-开放智能micro5个月前
016211
当前大模型技术超全总结!-开放智能

当前大模型技术超全总结!

本文分为三个章节,深入浅出地解读大模型的技术,具体如下三个部分:1、GPT、LLaMA、ChatGLM、Falcon等大语言模型的技术细节比较在深入研究LLaMA、ChatGLM和Falcon等大语言模型时,我们不难发现...
micro的头像-开放智能micro3个月前
016112
英伟达不是硬件公司,英伟达代表一种未来的系统-开放智能

英伟达不是硬件公司,英伟达代表一种未来的系统

老黄参加 'Squawk on the Street '节目,讨论 Nvidia 在下一代半导体方面的工作、加速计算背后的理论等老黄说B200是世界上最大的芯片有 2080 亿个晶体管,这个芯片的价格大约是3-4万美元,这一...
micro的头像-开放智能micro6个月前
01617
李飞飞团队年度报告揭底大模型成本-开放智能

李飞飞团队年度报告揭底大模型成本

如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结。今天,斯坦福 HAI 研究所发布了第七个年度的 AI Index 报告,这是关于人工智能行业现状的最全面的报告之一。打开网...
micro的头像-开放智能micro5个月前
016010
国产文生视频大模型Vidu将迎更新:支持生成32秒内容-开放智能

国产文生视频大模型Vidu将迎更新:支持生成32秒内容

据“钛媒体 AGI”周四报道,生数科技、清华大学联合发布的国内首个长时长、高一致性、高动态性的视频大模型 Vidu 将于近期完成三大更新,实现“重大技术迭代”。打开网易新闻 查看更多图片 主要...
micro的头像-开放智能micro3个月前
016014
3140亿参数Grok-1推理加速3.8倍-开放智能

3140亿参数Grok-1推理加速3.8倍

马斯克说到做到开源Grok-1,开源社区一片狂喜。但基于Grok-1做改动or商用,都还有点难题:Grok-1使用Rust+JAX构建,对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。打开网...
micro的头像-开放智能micro6个月前
016010
快手Agents系统、模型、数据全部开源!-开放智能

快手Agents系统、模型、数据全部开源!

7B 大小的模型也能玩转 AI Agents 了?近期,快手开源了「KwaiAgents」,问它周末滑雪问题,它不但帮你找到场地,连当天的天气都帮你考虑周到了。  打开网易新闻 查看更多图片 大家都知道大语...
micro的头像-开放智能micro10个月前
015911