排序
Ascend C sqrt 算子实战
本文分享自华为云社区《【2023・CANN 训练营第一季】——Ascend C sqrt 算子实战》,作者:dayao。 前言 编写一个 Ascend C 的 sqrt 算子,并通过内核调用方式在 cpu 和 npu 模式下进行验证。在...
OpenAI 用45分钟重塑游戏规则!干掉 MJ、LangChain
北京时间 11 月 7 日凌晨 02:00,OpenAI 的首次 DevDay 开发者日活动正式开始。Sam Altman 用了 45 分钟的时间发布了多款新产品。微软 CEO Satya Nadella 还亲自去现场参与了这次发布。此次,Op...
ChatGPT参数规模被扒:只有7B
ChatGPT惨遭攻击,参数规模终于被扒出来了——很可能只有7B(70亿)。消息来自南加州大学最新研究,他们使用一种攻击方法,花费不到1000美元就把最新版gpt-3.5-turbo模型的机密给挖了出来。打开...
OpenAI等25个机构祭大招,一眼辨别AI机器人
最近半个月,全网竟被一个OpenAI的「AI爆料人」愚弄了。听到「草莓哥」@iruletheworldmo账号,想必每个人都很熟悉,而且时不时就会刷到他的爆料帖子。直到这周三,所有人没有等来他预测的GPT-4o...
不到1000行代码,PyTorch团队让Llama 7B提速10倍
PyTorch 团队亲自教你如何加速大模型推理。 在过去的一年里,生成式 AI 发展迅猛,在这当中,文本生成一直是一个特别受欢迎的领域,很多开源项目如 llama.cpp、vLLM 、 MLC-LLM 等,为了取...
OpenAI 创始成员用 1000行手搓了一个大模型,Mac 即可运行
徒手用 1000 行 C 语言实现,不依赖庞大的外部库,Mac 即可运行。如今这年头,徒手写神经网络代码已经不算事儿了,现在流行手搓大模型训练代码了!这不,今天,特斯拉前 AI 总监、OpenAI 创始团...
模型即产品,Agent的未来要靠模型而不是Workflow
知名 AI 工程师、Pleias 的联合创始人 Alexander Doria 最近针对 DeepResearch、Agent 以及 Claude Sonnet 3.7 发表了两篇文章,颇为值得一读,尤其是 Agent 智能体的部分。Alexander 的观点很...
中文LLaMA-2刷榜,千元预算,效果媲美主流大模型
最强中文版LLaMA-2来了!15小时训练,仅需数千元算力,性能碾压同级中文汉化模型,开源可商用。LLaMA-2相较于LLaMA-1,引入了更多且高质量的语料,实现了显著的性能提升,全面允许商用,进一步...
直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral
这几天引发了AI社区大讨论的逼近GPT-4性能的泄漏模型「miqu」,的确是Mistral公司训练的一个旧模型的量化版。此前,冲上各大榜单的这个开源模型引发开发者热议,开源AI或已进入关键时刻。破案...
SQL+向量驱动大模型和大数据新范式,MyScale开源
大模型(LLM)的浪潮已经涌动一年多了,尤其是以 GPT-4、Gemini-1.5、Claude-3 等为代表的模型你方唱罢我登场,成为当之无愧的风口。在 LLM 这条赛道上,有的研究专注于增加模型参数,有的疯...