排序
训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解
北京大学和中山大学等机构研究者提出了统一的视觉语言大模型 ——Chat-UniVi。通过构建图片和视频统一表征,该框架使得一个 LLM 能够在图片和视频的混合数据下训练,并同时完成图片和视频理解...
英伟达最强通用大模型Nemotron-4登场
许久未更新大模型的英伟达推出了150亿参数的Nemotron-4,目标是打造一个能在单个A100/H100可跑的通用大模型。最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8T token上完成了训练...
微调Mistral-7B实现86.81%准确率
小模型也能解锁数学能力,无需多模型集成,7B模型在GSM 8 k数据集上性能超越70B!对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。比如之前有研究结果显示,在GSM 8K基准测...
OpenAI首个AI视频模型炸裂登场,端掉行业饭碗!
卷疯了卷疯了,短短十几小时内,OpenAI和谷歌接连发布核弹级成果。国内还没睡的人们,经历了过山车般的疯狂一晚。就在刚刚,OpenAI突然发布首款文生视频模型——Sora。简单来说就是,AI视频要变...
亚马逊刚投40亿美元,谷歌等又要投20亿,Anthropic 估值狂飙
为挑战OpenAI,Anthropic 遵循了与对手类似的道路。据科技新闻网站 The Information 报道,在宣布亚马逊高达 40 亿美元的新投资后不久,人工智能初创公司 Anthropic 正在就 20 亿美元融资进行早...
虚拟和现实世界已分不清!OpenAI首个AI视频模型
OpenAI Sora宣传视频(00:59)“一名时尚女子走在充满霓虹灯和广告牌的标志性东京街头,她穿着黑色皮夹克、红长裙和黑靴子,拎着黑色手袋,戴着太阳镜,涂着红色口红,走路自信又随意。街道潮湿且...
清华系面壁智能给大模型接入16000+真实API,开源ToolLLM
ChatGPT能力解禁,还是加入插件功能后,性能得到了强化。所有大模型皆是如此。面壁智能给大模型接入16000+真实API,性能匹敌ChatGPT。这段时间,开源大语言模型(LLM)可谓是进步飞快,像是 L...
PyTorch团队重写「分割一切」模型,比原始实现快8倍
我们该如何优化 Meta 的「分割一切」模型,PyTorch 团队撰写的这篇博客由浅入深的帮你解答。 从年初到现在,生成式 AI 发展迅猛。但很多时候,我们又不得不面临一个难题:如何加快生成式 AI ...
打造ChatGPT平替,成本暴降95%!
为了吸引更多开发者,OpenAI正在计划一波重大更新,并且让构建ChatGPT应用的成本降低多达20倍!天下开发人员,苦OpenAI模型价格久矣。路透爆料称,在11月6日首届开发者大会上,OpenAI将推出年度...
让 Kimi Chat 学完了整本周易,给 Sam Altman 算了一卦
最近,Kimi Chat 的上下文长度从 20 万汉字升级到了200 万汉字,10 倍的差距已经足够产生一次质变,做很多之前做不了的事情。感谢月之暗面给了提前测试的机会,我们直接开测!场景1:做SEO搜...