近日,搜狗公司原CEO王小川创办的百川智能正式发布参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。
王小川表示:“我们期待国内大模型行业以及垂直领域能够在此基础上开发出更多优秀产品及行业应用,让技术在真实、丰富的应用场景中快速迭代创新,我们愿与众多企业、开发者一道为国内开源社区的生态繁荣贡献自己的力量。”
优势和劣势
“现在做大模型的公司很多,但做大模型尤其是通用人工智能大模型很烧钱。”一位人工智能从业者向《中国经营报》记者说,目前大模型赛道很热,但是最后跑出来估计也就3~4家,其他估计是围绕这几家做相关的生态和应用落地。
上述人士称,对于大模型创业公司而言,数据是个大问题,还有算力问题,训练成本也很高。OpenAI有特殊性,其前期获得好几个巨头的支持,现在很少有巨头这样支持创业公司了,很多都得自己做。
2023年4月10日,王小川官宣创办百川智能——一家研发并提供AGI(通用人工智能)服务的中国公司,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。百川智能宣称将借助语言AI的突破,构建“中国最好的大模型底座”,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠地获取世界知识和专业服务。
谈及公司名称的来源,王小川解释道:“百川本意是众多的河流汇集奔赴海洋,象征着众多数据、行业知识汇聚成为一个强大的智能体系,生生不息。百川也象征着集百家智慧,更多人与其一道共赴山海。”
王小川的逻辑是“知识密集型”领域是他核心要突破的点,教育和医疗就是他眼中的知识密集型方向。他一直在追求“生命的意义”。
据了解,通用大语言模型Baichuan-13B-Base是百川智能发布的第二款通用大语言模型,而在前不久的6月15日,百川智能就已经推出了首款70亿参数量的中英文语言模型Baichuan-7B,并一举拿下多个世界权威Benchmark榜单同量级测试榜首。
谈及百川智能的优劣势,爱分析首席分析师李喆向本报记者说:“百川智能目前做的是基础大模型,未来应该是要做通用大模型和B端/C端应用。我们目前是按照算力资源、数据集、AI工程化和生态四个维度对大模型厂商进行评估,百川智能的优势是数据集和AI工程化能力,数据集是有中文场景语料数据积累,AI工程化方面主要体现在其算法框架层和模型层的优势,算力资源和生态相比其他厂商存在劣势,百川‘屯卡’(指GPU板卡)时间太晚,推出基础模型的时间也落后于其他大模型厂商。”
李喆称,C端受限于监管等因素,短期发展不会特别快,重点肯定是B端。B端一般会从大模型厂商未来商业模式出发,去思考大模型市场的未来竞争格局。大模型厂商未来商业模式包括:一是API调用、二是大模型license/一体机、三是行业应用(应用产品、解决方案)。API调用未来肯定都是云厂商的市场机会,百川智能的机会在于大模型license/一体机和行业应用,比较看好百川在行业应用方面的市场机会。
机遇和挑战
此前,王小川曾向媒体说:“追上ChatGPT水平,我觉得今年内就可能实现,但对于GPT-4或者GPT-5,我认为可能需要三年左右的时间,应该不会低于两年。”
王小川坦言,当下国内大厂产品和ChatGPT有较大差距,我们就要不断追OpenAI。“现在首先百川智能要做的,就是中国最好的大模型,然后去美国挖人才再追它(OpenAI)。这比较现实一点,人家做‘长生不老丸’,我们先做个‘延年益寿丸’。”
百川智能的对手很多,国产大模型“军备竞赛”以“天”为计不断更新,阿里巴巴、华为、京东、商汤都在争夺这趟通用人工智能(AGI)列车席位。
掌柜智库高级顾问沈阳告诉本报记者,对比其他AI公司,百川智能的优势有:一是技术理想,公司具有优势,王小川目前是最好的状态,也是国内在AGI领域认知最深刻、最有资本和人才、最有国际视野的人,他的认知超越同行,至少是当下最领先。特别是他的技术洁癖,可以远离商业,追求AGI的突破。二是中华传统文化的浸润较多,目前的领先公司多是海外公司,王小川具备传统中华文化的底蕴。三是对AGI的认知深刻,这是王小川的百川智能最大的亮点,也可能是其他AI公司无法触及的高度,百川智能是目前国内能看见的最有可能突破AGI的公司。
沈阳认为,谨慎看好的原因则是:一方面王小川一直比较顺利,没有经历太大的磨难,可能在自我的修炼和提升上,还没有遇见大的障碍和瓶颈,这样可能不太具备巨大的突破能力,这个确实是个人修为的问题;另一方面目前医疗和教育领域可能是最好的AGI的突破领域,但是解决的路径太“物化”,更多在看资本、人才、算力、资源等这些领域,没有太关注“意识”和“认知”这些高维度能量的领域,这可能是一个缺陷。
王小川表示:“Baichuan-13B是百川智能为科技强国送上的一份礼物。”
暂无评论内容