排序
吴恩达开源大模型套件:11个模型平台一种方式调用
吴恩达发布的开源大模型套件aisuite,不到半天就斩获了1200+星标(同步更新时已有1.8k)。它把11家知名大模型平台集中到了一起,统一了接口,可以用相同的方式调用不同模型。切换模型时,只需要...
DeepSeek满血微调秘籍来了
全网首发!DeepSeek V3/R1满血版低成本监督微调秘籍来了,让高达6710亿参数AI巨兽释放最强性能。DeepSeek V3/ R1火爆全网,基于原始模型的解决方案和API服务已随处可见,陷入低价和免费内卷。...
开放是AI风险的唯一解
来源:北京商报 2024世界人工智能大会暨人工智能全球治理高级别会议7月4日开幕,全球智囊相聚中国相约上海,探讨人工智能(AI)之于全球经济和人类未来。 三位图灵奖获得者姚期智、杰·瑞迪、曼...
稚晖君玩了个大的:开源人形机器人全套图纸+代码
赶着1024的程序员节,刚刚稚晖君发了个大福利: 智元人形机器人,全套资料全球开源,包括设计图纸和代码! 打开网易新闻 查看更多图片 具体而言,这次开源的是智元家的灵犀X1,就是今年8月...
模型即产品,Agent的未来要靠模型而不是Workflow
知名 AI 工程师、Pleias 的联合创始人 Alexander Doria 最近针对 DeepResearch、Agent 以及 Claude Sonnet 3.7 发表了两篇文章,颇为值得一读,尤其是 Agent 智能体的部分。Alexander 的观点很...
阿里蔡崇信:闭源大模型的开发价值已几乎为零
近日,在阿联酋迪拜举办的World Governments Summit 2025峰会上,阿里巴巴联合创始人、董事会主席蔡崇信谈论了对开源大模型的看法。 蔡崇信对外表示,DeepSeek让我们看到了开源的价值。”现在...
Ascend C sqrt 算子实战
本文分享自华为云社区《【2023・CANN 训练营第一季】——Ascend C sqrt 算子实战》,作者:dayao。 前言 编写一个 Ascend C 的 sqrt 算子,并通过内核调用方式在 cpu 和 npu 模式下进行验证。在...
DeepSeek开源DeepEP通信库
DeepSeek开源第二弹如期而至。这一次,他们把MoE训推EP通信库DeepEP开源了,支持FP8专为Hopper GPU设计,低延迟超高速训练推理。刚刚,DeepSeek放出了开源第二弹——DeepEP!它拥有高效优化的al...
阿里开源全新推理模型QwQ-32B
3 月 6 日,阿里巴巴旗下的 Qwen 团队用一条题为《QwQ-32B:拥抱强化学习的力量》的博文公布了全新的开源大型推理模型 QwQ-32B(Qwen-with-Questions),这款仅有 320 亿参数的模型通过强化学习...
马斯克最新回应:OpenAI 的“邮件攻击”在说谎!
这位亿万富翁总是有办法吸引全世界的关注。 近年来,人工智能技术的快速发展引起了广泛关注。然而,这项技术的发展也带来了一系列争议和问题。上周,亿万富翁埃隆·马斯克对美国人工智能公司 O...