最近的两个月,国内的各种 AI 大模型百花齐放。
腾讯姗姗来迟,上周正式对外开放了自研的「混元大模型」(文末附内测申请网址)。
三顿第一时间申请了体验,没想到审核速度挺快:
赶紧第一时间给大家做个简单测评,一起看看这个新鲜出炉的智能 AI。
目前开放了微信小程序和网页两个版本:
可以快速生成文案:
撰写工作邮件:
写好一整篇长文:
让我比较惊喜的是它对于一些陷阱问题的优化,比如这个做菜问题:
和 GPT3.5 和讯飞的星火大模型做个对比,这两个都是一本正经的胡编乱造:
腾讯混元可以准确判断出来:
这也是混元大模型主打的能力,通过优化有效降低了 AI 模型的幻觉率,各种语义上胡编乱造的情况少有出现:
文本的生成和语义的理解都还不错,但我体验下来也有明显存在缺陷的地方。
比如在发布会里,混元强调了它的「思维链新策略」,可以更好地拆解分析问题,做出推理判断。
我拿了一道很简单的小学数学题测试:
人家讯飞星火还挺实诚,干脆利落的给了个错误答案:
结果腾讯这个,是一本正经的胡说八道:
一般这样的简单推理,在加上「咒语」之后,AI 大模型都能给出准确答案。比如讯飞:
又比如 GPT-3.5:
腾讯混元依然是一本正经的胡说八道:
还有在功能的丰富度上,腾讯混元目前只提供了这个很简单的应用商店:
而隔壁讯飞已经支持了多模态,识别图片、自动配音、生成视频都不在话下。
但我依然还挺期待,因为腾讯在发布会上表示,更多会关注模型在自家工具上的应用。
比如结合腾讯会议,快速总结内容:
结合腾讯文档,总结归纳、快速处理表格:
还有生成各类的图文海报:
当然,这一切的前提是:
你得知道如何使用 AI;
如何向 AI 提问。
暂无评论内容