经验-开放智能-第6页

如何从头开始编写LoRA代码，这有一份教程

LoRA（Low-Rank Adaptation）作为一种用于微调 LLM（大语言模型）的流行技术，最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其他技...

micro4个月前

016712

六大顶尖高校联手发布全新Gen4Gen框架

文中提出了一个半自动数据集创建管道Gen4Gen，将个性化概念与文本描述结合成复杂的组合，创建了基准测试数据集MyCanvas，利用CP-CLIP 和 TI-CLIP指标证明了该方法的有效性。过去几年里，基于...

micro5个月前

016712

「哄哄模拟器」24小时爆火

和女朋友的一次吵架，让这位开发者做出了一个24小时内用户达60万的AI应用，直接引爆了00后和10后聚集的QQ群！10亿token一天就烧完，也是难倒了开发者……24小时，70万用户，10亿tokens，一个...

micro8个月前

016611

OpenAI 创始成员用 1000行手搓了一个大模型，Mac 即可运行

徒手用 1000 行 C 语言实现，不依赖庞大的外部库，Mac 即可运行。如今这年头，徒手写神经网络代码已经不算事儿了，现在流行手搓大模型训练代码了！这不，今天，特斯拉前 AI 总监、OpenAI 创始团...

micro5个月前

016611

苹果一次性开源了8个大模型！

不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架，涵盖训练日志、多个保存点和预训练设置。同时升级计算机视觉工具包 CVNets 为 CoreNet！支持 OpenELM！ ▲图1.由Stable D...

micro5个月前

01655

Mamba架构第一次做大！混合Transformer，打败Transformer

精彩精彩，第一个把爆火Mamba架构真正扩展到足够大的工作来了。520亿参数，还是Mamba+Transformer混合架构。它的名字叫Jamba。打开网易新闻查看更多图片取两种架构之长，模型质量和效率兼得...

micro5个月前

01659

OpenAI将允许公司个性化其最强大模型GPT-4o

美东时间8月20日（周二），OpenAI宣布将面向企业客户推出“个性化定制服务”，允许使用各自的公司数据来“微调”（Fine-tuning）其目前最强大的AI模型GPT-4o。有分析称，对于OpenAI当前的旗舰模...

micro1个月前

01646

Meta无限长文本大模型来了：参数仅7B，已开源

Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力，虽然存在线性注意力和状态空间模型等次二次解决方案，但从以往的经验来看，它们在预训练效率和下游任务准确性方面表现不...

micro5个月前

016410

硅谷近8000人疑被AI淘汰

就在刚刚，谷歌CEO劈柴在公开信中承认：谷歌的裁员计划还要持续一整年，还有更多岗位会被淘汰，且持续一整年。根据Layoffs数据，开年不到一个月，科技公司总共已裁掉7,785名员工。AI真来淘汰...

micro8个月前

016415

国内NLP创业团队白熊AI首曝光：大模型训练和智能体开发平台齐发

钛媒体App独家获悉，一支来自国内外顶尖NLP实验室的创业团队——白熊AI（ICEBEAR AI），已完成千万级人民币天使轮融资，并正式推出自主研发的Polar Agent智能体开发平台和Arctic Lab大模型训...

micro3个月前

01638

加载更多

如何从头开始编写LoRA代码，这有一份教程

六大顶尖高校联手发布全新Gen4Gen框架

「哄哄模拟器」24小时爆火

OpenAI 创始成员用 1000行手搓了一个大模型，Mac 即可运行

苹果一次性开源了8个大模型！

Mamba架构第一次做大！混合Transformer，打败Transformer

OpenAI将允许公司个性化其最强大模型GPT-4o

Meta无限长文本大模型来了：参数仅7B，已开源

硅谷近8000人疑被AI淘汰

国内NLP创业团队白熊AI首曝光：大模型训练和智能体开发平台齐发

近期文章

近期评论