排序
国内NLP创业团队白熊AI首曝光:大模型训练和智能体开发平台齐发
钛媒体App独家获悉,一支来自国内外顶尖NLP实验室的创业团队——白熊AI(ICEBEAR AI),已完成千万级人民币天使轮融资,并正式推出自主研发的Polar Agent智能体开发平台和Arctic Lab大模型训...
OpenAI官方透露GPT-5发布时间,模型能力从高中飞跃到博士!
OpenAI首席技术官Mira Murati在专访中透露,备受期待的GPT-5预计将在2025年底或2026年初发布,其智能水平将实现质的飞跃,达到特定任务的“博士级”。人工智能领域即将迎来一次重大突破。Op...
英伟达,突然开源!
当地时间6月14日,英伟达开源Nemotron-4 340B(3400亿参数)系列模型。打开网易新闻 查看更多图片 据英伟达介绍,开发人员可使用该系列模型生成合成数据,用于训练大型语言模型(LLM),用于医疗...
揭秘HuggingFace规模最大、质量最高预训练数据集
从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训练提供更优质的性能。大型语言模型(LLMs)的性能在很大程度上取决于它的...
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!
极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。...
AI公司HeyGen正逼走中国风投,强制要求红杉中国、真格等
钛媒体App 6月8日消息,据报道,成立于深圳、后来把总部迁到美国洛杉矶的生成式 AI 初创公司HeyGen,要求其中国投资者IDG资本、百度风投、红杉中国、真格基金(ZhenFund)把股权卖给美国投资...
国产文生视频大模型Vidu将迎更新:支持生成32秒内容
据“钛媒体 AGI”周四报道,生数科技、清华大学联合发布的国内首个长时长、高一致性、高动态性的视频大模型 Vidu 将于近期完成三大更新,实现“重大技术迭代”。打开网易新闻 查看更多图片 主要...
当前大模型技术超全总结!
本文分为三个章节,深入浅出地解读大模型的技术,具体如下三个部分:1、GPT、LLaMA、ChatGLM、Falcon等大语言模型的技术细节比较在深入研究LLaMA、ChatGLM和Falcon等大语言模型时,我们不难发现...
全球140+大模型全方位评测结果出炉,智源评测体系发布
2024 年 5 月 17 日,智源研究院举办大模型评测发布会,正式推出科学、权威、公正、开放的智源评测体系,发布并解读国内外 140 余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本...
百川新模型冲顶中文测试基准!首款AI助手百小应
王小川在搜索时期种下的种子,在大模型时代又开花了。他创业的百川智能,刚刚发布了自家首款AI应用,to C的“百小应”。乍一看,这就是个当下大热门的AI助手,但官方强调,这个AI助手啊,它懂搜...