排序
LLM上下文窗口突破200万!无需架构变化+复杂微调
LongRoPE方法首次将LLM的窗口扩展到了2048k个token,只是简单微调的情况下,就能实现与短上下文窗口相近的性能!大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文...
开源版AI程序员来了:GPT-4加持,能力比肩Devin
最近,有很多人在为 AI 代替自己的工作而担忧。上个月火遍 AI 圈的「首位 AI 程序员」Devin,利用大模型能力已经掌握了全栈技能,仅需要人类给出自然语言指令,就可以自动完成复杂的代码任务...
Llama3,凭什么价值百亿美金?
4月19日,Facebook母公司Meta重磅推出了Llama3。即便大家现在对于大厂和巨头频繁迭代AI模型的行为已经见怪不怪,Meta的Llama3仍旧显得与众不同,因为这是迄今最强大的开源AI模型。Meta推出了重...
拜登召集奥特曼和李飞飞等入AI安全委员会
美国总统拜登最近成立了一个新的人工智能安全委员会,目的是解决人工智能技术可能对电网、机场等关键基础设施带来的潜在威胁。国土安全部部长Alejandro Mayorkas是委员会的主席,他强调:“如...
当前大模型技术超全总结!
本文分为三个章节,深入浅出地解读大模型的技术,具体如下三个部分:1、GPT、LLaMA、ChatGLM、Falcon等大语言模型的技术细节比较在深入研究LLaMA、ChatGLM和Falcon等大语言模型时,我们不难发现...
英伟达不是硬件公司,英伟达代表一种未来的系统
老黄参加 'Squawk on the Street '节目,讨论 Nvidia 在下一代半导体方面的工作、加速计算背后的理论等老黄说B200是世界上最大的芯片有 2080 亿个晶体管,这个芯片的价格大约是3-4万美元,这一...
李飞飞团队年度报告揭底大模型成本
如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结。今天,斯坦福 HAI 研究所发布了第七个年度的 AI Index 报告,这是关于人工智能行业现状的最全面的报告之一。打开网...
国产文生视频大模型Vidu将迎更新:支持生成32秒内容
据“钛媒体 AGI”周四报道,生数科技、清华大学联合发布的国内首个长时长、高一致性、高动态性的视频大模型 Vidu 将于近期完成三大更新,实现“重大技术迭代”。打开网易新闻 查看更多图片 主要...
3140亿参数Grok-1推理加速3.8倍
马斯克说到做到开源Grok-1,开源社区一片狂喜。但基于Grok-1做改动or商用,都还有点难题:Grok-1使用Rust+JAX构建,对于习惯Python+PyTorch+HuggingFace等主流软件生态的用户上手门槛高。打开网...
快手Agents系统、模型、数据全部开源!
7B 大小的模型也能玩转 AI Agents 了?近期,快手开源了「KwaiAgents」,问它周末滑雪问题,它不但帮你找到场地,连当天的天气都帮你考虑周到了。 打开网易新闻 查看更多图片 大家都知道大语...