排序
Meta 发布全球最大开源模型Llama 3.1 405B
要点总结: 最大的模型 Llama 3.1 405B 也会开源。马克·扎克伯格发布公开信,详细了解开源为何对开发者、对 Meta 和对世界都有好处。 最新模型将上下文长度扩展到 128K、增加了对八种...
英伟达,突然开源!
当地时间6月14日,英伟达开源Nemotron-4 340B(3400亿参数)系列模型。打开网易新闻 查看更多图片 据英伟达介绍,开发人员可使用该系列模型生成合成数据,用于训练大型语言模型(LLM),用于医疗...
当前大模型技术超全总结!
本文分为三个章节,深入浅出地解读大模型的技术,具体如下三个部分:1、GPT、LLaMA、ChatGLM、Falcon等大语言模型的技术细节比较在深入研究LLaMA、ChatGLM和Falcon等大语言模型时,我们不难发现...
250行代码从头搭建Llama 3,GitHub一天4.6k星!
Llama 3发布一个月后,一位开发者在GitHub上创建了名为「从头开始实现Llama 3」的项目,引起了开源社区的广泛关注。代码非常详细地展现了Llama所使用的Transformer架构,甚至让Andrej Karpathy...
腾讯混元开放代码和算法,可免费商用
随着AIGC的逐渐普及,你有没有发现越来越多的人开始用大模型自制微信头像?不过,许多文生图大模型仍然存在诸多不足,例如质感不强、图像畸变等。而今,秉持着实用研发思路的腾讯混元文生图大...
承诺十年不套现, 62岁的李开复要陪AI大模型“长跑”
“我个人之所以做这个事情(创办零一万物),是因为这是我40多年的梦想,我在写博士申请信时就提到,AGI是我的梦想,今天,我有了实现这个梦想的机会,而这也是推动我努力的主要动力”。 5月13...
阿里云百炼平台全面升级,支持企业级RAG
5月9日,在北京阿里云AI智领者峰会上,阿里云CTO周靖人公布百炼大模型平台最新进展。百炼平台从模型开发、应用开发到算力底座全面升级,更加易用、更加开放,引入更多模型,还率先兼容LlamaInde...
SQL+向量驱动大模型和大数据新范式,MyScale开源
大模型(LLM)的浪潮已经涌动一年多了,尤其是以 GPT-4、Gemini-1.5、Claude-3 等为代表的模型你方唱罢我登场,成为当之无愧的风口。在 LLM 这条赛道上,有的研究专注于增加模型参数,有的疯...
所有生命分子皆可AI预测!AlphaFold3来了
AlphaFold 3再登Nature!这次重磅升级,不再仅限于蛋白质结构预测——可以以前所未有的精度预测所有生命分子的结构和相互作用。 只有了解它们如何在数百万种组合中相互作用,我们才能开始真正...
如何从头开始编写LoRA代码,这有一份教程
LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大语言模型)的流行技术,最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。不同于其他技...