马斯克版ChatGPT背后开发工具上线!xAI产品两连发
马斯克版ChatGPT才刚吸引一波眼球,xAI第二款大模型产品就突然登场了!就在刚刚,马斯克旗下xAI官宣:推出PromptIDE。 一个用于提示工程和可解释性研究的集成开发环境。 打开网易新闻 查看更...
GPT-4V学会用键鼠上网,人类眼睁睁看着它发帖玩游戏
GPT-4V学会自动操纵电脑,这一天终于还是到来了。只需要给GPT-4V接入鼠标和键盘,它就能根据浏览器界面上网: 打开网易新闻 查看更多图片 甚至还能快速摸清楚“播放音乐”的播放器网站和按钮...
苹果版CUDA来了!专为自家芯片打造,M3 Max可跑每秒迭代2.8次
苹果新发布适用于苹果芯片的机器学习框架MLX,MLX是一个类似于NumPy的阵列框架,旨在为使用苹果硬件的研究人员简化 ML 模型的训练和部署。一直以来,英伟达CUDA称霸天下,使得它在AI领域的势...
媲美GPT-4的开源模型泄露!Mistral老板刚刚证实
Mistral-Medium竟然意外泄露?此前仅能通过API获得,性能直逼GPT-4。CEO最新发声:确有其事,系早期客户员工泄露。但仍表示敬请期待。打开网易新闻 查看更多图片 换句话说,这个版本尚且还是旧...
前谷歌科学家离职创业1年,自述训练LLM卡在算力上!
前谷歌大脑科学家Yi Tay去年3月离职后,创办了一家初创公司。创业一年,他发文表示「痛并快乐着」。 在这篇博文中,我讨论了: 1. 在不同计算提供商中采购计算和差异的经验。我们最大的发现/惊...
Mamba架构第一次做大!混合Transformer,打败Transformer
精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
2024年全球生成式AI行业市场现状分析
行业主要上市公司:百度(BIDU.O);科大讯飞(002230);腾讯(0700.HK);阿里巴巴(BABA.N);商汤科技(0020.HK);拓尔思(300229);出门问问(2438.HK)等。本文核心数据:全球生成式AI产品应用需求调查;全...
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!
极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
GitHub官宣接入Claude+Gemini
OpenAI再也不是微软的唯一解。第十届GitHub开发者大会上,微软官宣GitHub Copilot同时接入Claude 3.5 Sonnet和Gemini 1.5 Pro两大模型。同时,还发布了0代码开发应用的「魔法」平台。AI代码生成...
GPT-4自我迭代,过程可控可解释
微软斯坦福研究人员发表新论文,提出STOP系统,通过迭代优化算法,让GPT-4能够针对任务,自我改进输出代码。这种不用改变模型权重和结构的自我优化方法,可以避免出现「自我进化的AI系统」的...