排序
2亿参数时序模型替代LLM?谷歌突破性研究被批
最近,谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。这篇论文的标题是「A decoder-only foundation model for time-series forecasting(用于时间序列预测的仅解码器基础模型)」。打...
开源版「ChatGPT Plus」来了,能做数据分析、插件调用、自动上网
来自香港大学、XLang实验室、Sea AI实验室和Salesforce的研究者联合打造了一款用于真实世界生产力工具的开源智能体框架——OpenAgents,并开源了全栈代码(完整前后端,研究代码),以满足从...
让 Kimi Chat 学完了整本周易,给 Sam Altman 算了一卦
最近,Kimi Chat 的上下文长度从 20 万汉字升级到了200 万汉字,10 倍的差距已经足够产生一次质变,做很多之前做不了的事情。感谢月之暗面给了提前测试的机会,我们直接开测!场景1:做SEO搜...
微调Mistral-7B实现86.81%准确率
小模型也能解锁数学能力,无需多模型集成,7B模型在GSM 8 k数据集上性能超越70B!对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。比如之前有研究结果显示,在GSM 8K基准测...
BT看AI!资深基因从业者评测国内外26个大模型
最近微信改版,容易找不到尹哥的文章,大家记得把尹哥设为星标⭐️ 哦~在人工智能的历史长河中,GPT-4无疑是一座里程碑,它不仅代表了OpenAI在自然语言处理领域的深厚积累,更是全球AI技术发...
微软AI程序员登场,10倍AI工程师真来了?
全球首个AI程序员Devin诞生之后,让码农纷纷恐慌。没想到,微软同时也整出了一个AI程序员——AutoDev,能够自主生成、执行代码等任务。网友惊呼,AI编码发展太快了。全球首个AI程序员Devin的...
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!
极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
天工大模型3.0将于4月17日发布,并将同步开源
日前昆仑万维方面宣布,天工大模型3.0将于4月17日、即天工大模型发布一周年之际开启公测,并将同步开源。据了解,天工3.0采用4千亿级参数MoE混合专家模型,号称是全球模型参数最大、性能最强...
全AI生成「芭本海默」病毒式疯转!
这段Midjourne和Gen-2生成的「芭本海默」预告片火了!疯狂传播后,网友们惊呼:这是原片吧?最近,一段用AI生成的芭比和奥本海默拼接电影——「芭本海默」(Barbenheimer)的预告片火了!每个镜...
AI Agent自主设计全新蛋白质登Nature!
这个自动化蛋白质设计系统可以自己设计和测试新的蛋白质,不需要人类的帮助。就像一个能自己做实验的机器人科学家。它能通过自主学习自行进行蛋白质设计,同时在实验室里自动进行测试。AI Agent...