排序
清华系大模型公司扎堆,真抱团还是假情谊?
图源:Unsplash如果给中国大模型企业的创业图谱建立一个坐标系,位于清华大学东门外十字路口一侧的搜狐网络大厦或许是最合适的坐标原点。张朝阳可能也没想到,昔日互联网风水宝地,如今承...
Llama3,凭什么价值百亿美金?
4月19日,Facebook母公司Meta重磅推出了Llama3。即便大家现在对于大厂和巨头频繁迭代AI模型的行为已经见怪不怪,Meta的Llama3仍旧显得与众不同,因为这是迄今最强大的开源AI模型。Meta推出了重...
六大顶尖高校联手发布全新Gen4Gen框架
文中提出了一个半自动数据集创建管道Gen4Gen,将个性化概念与文本描述结合成复杂的组合,创建了基准测试数据集MyCanvas,利用CP-CLIP 和 TI-CLIP指标证明了该方法的有效性。过去几年里,基于...
阿里云全方位支持Llama 3 训练推理,并提供免费算力
4月18日,Meta开源最新Llama 3系列,阿里云魔搭社区第一时间上架全部4款模型。今天,阿里云百炼大模型服务平台宣布在国内首家推出针对Llama 3系列的限时免费训练、部署、推理服务,企业和开发者...
Meta无限长文本大模型来了:参数仅7B,已开源
Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力,虽然存在线性注意力和状态空间模型等次二次解决方案,但从以往的经验来看,它们在预训练效率和下游任务准确性方面表现不...
让大语言模型与真实物理世界进行交互
近日,新加坡南洋理工大学博士生、香港科技大学研究助理徐华韬和所在团队,打造了一个名为“渗透式人工智能(Penetrative AI)”的项目。打开网易新闻 查看更多图片 图 | 徐华韬(来源:徐华韬...
波士顿动力发布新一代Atlas机器人
大半夜的,本来想睡了。然后看到昨天在我朋友圈疯狂刷屏的波士顿动力,就在刚刚,又刷了一次屏。在如今AI和具身智能爆火的今天,人形机器人的明星公司波士顿动力,昨天宣布正式下线了他们的液压...
李飞飞团队年度报告揭底大模型成本
如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结。今天,斯坦福 HAI 研究所发布了第七个年度的 AI Index 报告,这是关于人工智能行业现状的最全面的报告之一。打开网...
github星标top5免费开源内网穿透工具
公网IP缺稀,现在的家用宽带或企业宽带都不很难获得独享的公网IP地址,也就是说以前路由器自带的端口映射,DMZ等功能基本上就废了,于是要想再从外部访问到你个人的电脑或设置,就需要用专业...
OpenAI 创始成员用 1000行手搓了一个大模型,Mac 即可运行
徒手用 1000 行 C 语言实现,不依赖庞大的外部库,Mac 即可运行。如今这年头,徒手写神经网络代码已经不算事儿了,现在流行手搓大模型训练代码了!这不,今天,特斯拉前 AI 总监、OpenAI 创始团...