排序
DeepSeek满血微调秘籍来了
全网首发!DeepSeek V3/R1满血版低成本监督微调秘籍来了,让高达6710亿参数AI巨兽释放最强性能。DeepSeek V3/ R1火爆全网,基于原始模型的解决方案和API服务已随处可见,陷入低价和免费内卷。...
UC伯克利等开源全新SOTA推理模型
近日,斯坦福、UC伯克利等多机构联手发布了开源推理新SOTA——OpenThinker-32B,性能直逼DeepSeek-R1-32B。其成功秘诀在于数据规模化、严格验证和模型扩展。32B推理模型,仅用1/8数据,与同尺寸...
阿里蔡崇信:闭源大模型的开发价值已几乎为零
近日,在阿联酋迪拜举办的World Governments Summit 2025峰会上,阿里巴巴联合创始人、董事会主席蔡崇信谈论了对开源大模型的看法。 蔡崇信对外表示,DeepSeek让我们看到了开源的价值。”现在...
美国朝DeepSeek打了一记重拳,斯坦福团队花146元复现AI模型
围绕中国开源 AI 公司深度求索(DeepSeek)热潮不断加剧,已成为全民热议的话题,同时也掀起一股新的AI热潮。而当前,美国企业界、学术界、政府机构纷纷开启“反击”热潮。首先是美国企业层面,...
吴恩达开源大模型套件:11个模型平台一种方式调用
吴恩达发布的开源大模型套件aisuite,不到半天就斩获了1200+星标(同步更新时已有1.8k)。它把11家知名大模型平台集中到了一起,统一了接口,可以用相同的方式调用不同模型。切换模型时,只需要...
稚晖君玩了个大的:开源人形机器人全套图纸+代码
赶着1024的程序员节,刚刚稚晖君发了个大福利: 智元人形机器人,全套资料全球开源,包括设计图纸和代码! 打开网易新闻 查看更多图片 具体而言,这次开源的是智元家的灵犀X1,就是今年8月...
智谱大模型,有了首个免费的API
最近一段时间,国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上,新发布的 Gemini 1.5 大模型序列中出现了 Flash 版,主打轻量化和响应速度。到 7 月,OpenAI 又在 GPT-4o 的基础上推...
OpenAI等25个机构祭大招,一眼辨别AI机器人
最近半个月,全网竟被一个OpenAI的「AI爆料人」愚弄了。听到「草莓哥」@iruletheworldmo账号,想必每个人都很熟悉,而且时不时就会刷到他的爆料帖子。直到这周三,所有人没有等来他预测的GPT-4o...
开放是AI风险的唯一解
来源:北京商报 2024世界人工智能大会暨人工智能全球治理高级别会议7月4日开幕,全球智囊相聚中国相约上海,探讨人工智能(AI)之于全球经济和人类未来。 三位图灵奖获得者姚期智、杰·瑞迪、曼...
GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费
刚刚,GPT-4o mini版迎来“高光时刻”——登顶了lmsys大模型竞技场,和满血版并列第一,还把Claude 3.5甩在了身后。打开网易新闻 查看更多图片 不同于一般的数据集测评,大模型竞技场是用户自己...