Meta宣布Llama 3细节:真正关键的模型后训练阶段
Meta 推出了Llama 3介绍视频,有几个细节值得分享给大家Llama 3模型本体 Llama 3 训练数据(15万亿token)是Llama 2的7倍,微调数据(1000条万人类标注)是Ll...
观点:AI对齐是一种危险的尝试
OpenAI“宫斗”大戏让AI“对齐”(alignment)一词不胫而走。好多人认为,奥尔特曼这样的邪恶资本代言人压制坚持对齐的正义科学代言人苏茨克维,我们要站在正义的一方。事实果真如此吗?通过...
加州理工华人用AI颠覆数学证明!
让陶哲轩大神赞不绝口的形式化研究神器Lean,运行LLM的推理却有个bug。最近,加州理工团队解决了这个bug,把80%以上的数学证明步骤,都自动化了!Lean Copilot,让陶哲轩等众多数学家赞不绝口...
腾讯协同办公产品全面用上大模型
4月22日,腾讯宣布旗下协作SaaS产品全面接入腾讯混元大模型,除企业微信、腾讯会议、腾讯文档,腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品也都已实现智能化升级。打开网...
OpenAI Lilian Weng撰文教你从头设计视频生成扩散模型
过去几年来,扩散模型强大的图像合成能力已经得到充分证明。研究社区现在正在攻克一个更困难的任务:视频生成。近日,OpenAI 安全系统(Safety Systems)负责人 Lilian Weng 写了一篇关于视频生...
月之暗面创始人杨植麟套现数千万美金
4月23日消息,界面新闻记者从多个渠道获悉,上一轮融资完成后,月之暗面(Moonshot AI)创始人杨植麟通过售出个人持股已套现数千万美金。作为创业公司,月之暗面目前仅成立一年。天眼查App显示...
清华系大模型公司扎堆,真抱团还是假情谊?
图源:Unsplash如果给中国大模型企业的创业图谱建立一个坐标系,位于清华大学东门外十字路口一侧的搜狐网络大厦或许是最合适的坐标原点。张朝阳可能也没想到,昔日互联网风水宝地,如今承...
Llama3,凭什么价值百亿美金?
4月19日,Facebook母公司Meta重磅推出了Llama3。即便大家现在对于大厂和巨头频繁迭代AI模型的行为已经见怪不怪,Meta的Llama3仍旧显得与众不同,因为这是迄今最强大的开源AI模型。Meta推出了重...
六大顶尖高校联手发布全新Gen4Gen框架
文中提出了一个半自动数据集创建管道Gen4Gen,将个性化概念与文本描述结合成复杂的组合,创建了基准测试数据集MyCanvas,利用CP-CLIP 和 TI-CLIP指标证明了该方法的有效性。过去几年里,基于...
阿里云全方位支持Llama 3 训练推理,并提供免费算力
4月18日,Meta开源最新Llama 3系列,阿里云魔搭社区第一时间上架全部4款模型。今天,阿里云百炼大模型服务平台宣布在国内首家推出针对Llama 3系列的限时免费训练、部署、推理服务,企业和开发者...