PyTorch团队重写「分割一切」模型,比原始实现快8倍
我们该如何优化 Meta 的「分割一切」模型,PyTorch 团队撰写的这篇博客由浅入深的帮你解答。 从年初到现在,生成式 AI 发展迅猛。但很多时候,我们又不得不面临一个难题:如何加快生成式 AI ...
GPT-4化身邪恶化学家!中国科大等发布首个
来自中科大等机构的联合团队提出了一种全新的方法——SciGuard,可以保护AI for Science模型,防止生物、化学、药物等领域模型不会被不当使用。与此同时,团队还建立了首个专注于化学科学领域...
直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral
这几天引发了AI社区大讨论的逼近GPT-4性能的泄漏模型「miqu」,的确是Mistral公司训练的一个旧模型的量化版。此前,冲上各大榜单的这个开源模型引发开发者热议,开源AI或已进入关键时刻。破案...
Yann Lecun :开源,LLM的局限性、AGI 和人工智能的未来
本文为1194字,建议阅读3分钟图灵奖获得者,Meta 首席科学家 Yann LeCun 最新接受 Lex Fridman 播客采访,整个采访2小时38分,探讨了一大堆内容,讨论了:开源的重要性、LLM 的局限性、为什...
OpenAI遭遇研发谜团:有时大模型很难学会,过后又能突然学会
两年前,OpenAI的研究人员尤里·布尔达(Yuri Burda)和哈里·爱德华兹(Harri Edwards)曾试图找出如何让一个大型语言模型进行基本运算。打开网易新闻 查看更多图片 (来源:OpenAI 官网)他们...
国产“Sora”火了!长度可达16秒
Sora席卷世界,也掀起了全球竞逐AI视频生成的热潮。就在今天,国内又有一支短片引发关注。视频来自生数科技联合清华大学最新发布的视频大模型「Vidu」。从官宣消息看,「Vidu」支持一键生成长达...
揭秘HuggingFace规模最大、质量最高预训练数据集
从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训练提供更优质的性能。大型语言模型(LLMs)的性能在很大程度上取决于它的...
当AI搜索开始赚钱养家
近期,在GPT-4o创造的新范式影响下,月暗、智谱、Perplexity和OpenAI相继上线了AI搜索推理功能。与此前“大海捞针”不同,最近更新中AI搜索长了“脑子”,在面对问题时,能像人一样先拆解步骤,...
2350万美元!Open AI投了一个“小公司”,只有16个员工
一家初创公司突然火起来,要么是创始人本身的名气和经历,要么就是被更大的企业投资。Mem属于后者。Mem公司成立于2019年,总部位于美国洛斯阿尔托斯山,是一款重塑用户信息搜集和整合的工具,由...
教育行业将迎颠覆性变化?OpenAI考虑将ChatGPT引入课堂
财联社11月17日讯(编辑 牛占林)人工智能初创公司OpenAI的首席运营官Brad Lightcap近日在一次会议上表示,OpenAI正在探索如何将其广受欢迎的聊天机器人ChatGPT带入课堂。Lightcap声称,OpenAI...