经验共221篇 第6页
如何从头开始编写LoRA代码,这有一份教程-开放智能

如何从头开始编写LoRA代码,这有一份教程

LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大语言模型)的流行技术,最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其他技...
micro的头像-开放智能micro4个月前
016712
六大顶尖高校联手发布全新Gen4Gen框架-开放智能

六大顶尖高校联手发布全新Gen4Gen框架

 文中提出了一个半自动数据集创建管道Gen4Gen,将个性化概念与文本描述结合成复杂的组合,创建了基准测试数据集MyCanvas,利用CP-CLIP 和 TI-CLIP指标证明了该方法的有效性。过去几年里,基于...
micro的头像-开放智能micro5个月前
016712
「哄哄模拟器」24小时爆火-开放智能

「哄哄模拟器」24小时爆火

 和女朋友的一次吵架,让这位开发者做出了一个24小时内用户达60万的AI应用,直接引爆了00后和10后聚集的QQ群!10亿token一天就烧完,也是难倒了开发者……24小时,70万用户,10亿tokens,一个...
micro的头像-开放智能micro8个月前
016611
OpenAI 创始成员用 1000行手搓了一个大模型,Mac 即可运行-开放智能

OpenAI 创始成员用 1000行手搓了一个大模型,Mac 即可运行

徒手用 1000 行 C 语言实现,不依赖庞大的外部库,Mac 即可运行。如今这年头,徒手写神经网络代码已经不算事儿了,现在流行手搓大模型训练代码了!这不,今天,特斯拉前 AI 总监、OpenAI 创始团...
micro的头像-开放智能micro5个月前
016611
苹果一次性开源了8个大模型!-开放智能

苹果一次性开源了8个大模型!

 不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架,涵盖训练日志、多个保存点和预训练设置。同时升级计算机视觉工具包 CVNets 为 CoreNet!支持 OpenELM! ▲图1.由Stable D...
micro的头像-开放智能micro5个月前
01655
Mamba架构第一次做大!混合Transformer,打败Transformer-开放智能

Mamba架构第一次做大!混合Transformer,打败Transformer

 精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数,还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻 查看更多图片 取两种架构之长,模型质量和效率兼得...
micro的头像-开放智能micro5个月前
01659
OpenAI将允许公司个性化其最强大模型GPT-4o-开放智能

OpenAI将允许公司个性化其最强大模型GPT-4o

美东时间8月20日(周二),OpenAI宣布将面向企业客户推出“个性化定制服务”,允许使用各自的公司数据来“微调”(Fine-tuning)其目前最强大的AI模型GPT-4o。有分析称,对于OpenAI当前的旗舰模...
micro的头像-开放智能micro1个月前
01646
Meta无限长文本大模型来了:参数仅7B,已开源-开放智能

Meta无限长文本大模型来了:参数仅7B,已开源

Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力,虽然存在线性注意力和状态空间模型等次二次解决方案,但从以往的经验来看,它们在预训练效率和下游任务准确性方面表现不...
micro的头像-开放智能micro5个月前
016410
硅谷近8000人疑被AI淘汰-开放智能

硅谷近8000人疑被AI淘汰

 就在刚刚,谷歌CEO劈柴在公开信中承认:谷歌的裁员计划还要持续一整年,还有更多岗位会被淘汰,且持续一整年。根据Layoffs数据,开年不到一个月,科技公司总共已裁掉7,785名员工。AI真来淘汰...
micro的头像-开放智能micro8个月前
016415
国内NLP创业团队白熊AI首曝光:大模型训练和智能体开发平台齐发-开放智能

国内NLP创业团队白熊AI首曝光:大模型训练和智能体开发平台齐发

 钛媒体App独家获悉,一支来自国内外顶尖NLP实验室的创业团队——白熊AI(ICEBEAR AI),已完成千万级人民币天使轮融资,并正式推出自主研发的Polar Agent智能体开发平台和Arctic Lab大模型训...
micro的头像-开放智能micro3个月前
01638