比尔·盖茨提到的AI私人助理,能响应自然语言,根据其对用户的深度了解完成各种任务,被称为“代理”(Agent)。
和Inflection AI推出的聊天机器人Pi不同,Agent可以在不同应用程序中执行不同任务,它们会不断了解用户,从而不断改进。
如果你想计划一次旅行,现有的聊天机器人只能找出符合预算的酒店,但Agent不仅了解你的旅行时间,还能推测出你的喜好,并做出深度个性化方案,像一家专业的旅行社。
如果你想和大学室友见面,你不需要检查自己的Schedule,也不用和其他几位室友反复约时间,因为你的Agent会和你大学室友们的Agents一起商量。
如果你想做一个APP,你不需要写代码,学设计。只需要告诉Agent你想要什么,它就能编写代码,进行UI设计,并将APP发布到在线商店。
“谁能赢得个人助理Agent,那才是大事。因为你将永远不会再去搜索网站,永远不会再去生产力网站,你永远不会再去亚马逊。”
实际上,比尔·盖茨在博文中提到,他已经“思考Agent近30年了,并在1995年的《未来之路》一书中写到过它们,但由于AI的进步,它们直到最近才变得实际可行”。
以下是全文翻译:
AI即将彻底改变你使用电脑的方式
时至今日,我仍然像当初和保罗·艾伦刚创立微软时那样热爱软件。尽管几十年来软件已经取得了很大改进,但在许多方面它仍然相当愚蠢。
无论在电脑上完成何种任务,你都必须告诉设备,它应该使用哪个应用程序。虽然你可以用Microsoft Word和Google Docs起草商业提案,但它们不能帮你发送电子邮件、分享自拍、分析数据、安排聚会或购买电影票。
即便是最好的网站也不能完全了解你的工作、个人生活、兴趣和人际关系,而且软件的能力有限,无法像亲密朋友或私人助理那样为你做事。
在未来的五年内,这种情况将彻底改变。你不必再为不同的任务而使用不同的应用程序。你只需用日常语言告诉你的设备你想要做什么。根据你选择与软件分享多少信息,基于对你生活的丰富了解,软件能够做出个性化的回应。在不久的将来,任何上网的人都能拥有一个远超今天技术水平的人工智能助手(Personal Assistant Powered by Artificial Intelligence)。
这种类型的软件,能回应自然语言并根据对用户的了解完成许多不同的任务,被称为Agent(代理)。我对Agent进行了近30年的思考,并在我1995年的书The Road Ahead(《通往未来之路》)中提及,但由于人工智能的进步,Agent直到最近才变得实用起来。
Agent不仅会改变每个人与计算机的交互方式,还将颠覆软件行业,引领我们从键入命令到点击图标以来计算机领域最大的革命。
01 人人都有私人助理Agent
一些批评者指出,软件公司以前也做过这种东西,但用户并不怎么接受它们。(大家仍拿 Clippy 开玩笑,Clippy 是我们曾在 Microsoft Office 中提供的数字助理,后来被弃置一边。)
那么,为什么人们会使用Agent?
答案是,Agent会变得更好。你能和它们进行细致入微的对话。它们更加个性化,不局限于写一封信这样的简单任务。Clippy与Agent的关系就像旋转号盘电话和移动设备的关系一样。
如果你愿意,Agent能帮助你做任何事。例如只要你授权同意,它会深入了解你参与的活动、交往的人物、所在地点。它会了解你的私人关系、工作关系、爱好偏好和日程安排。你可以选择Agent在何时,以何种方式帮助你做某事或让你做决定。
“Clippy是一个机器人,而不是Agent。”
我们现在用的人工智能工具大部分都只是机器人而已。它们仅限于一个应用程序,并且通常只在你写入特定单词或请求帮助时才会介入。这是因为它们不记得你的使用习惯,也就不会变得更好,不会学习你的任何偏好。Clippy是一个机器人,而不是Agent。
Agent更加智能。它们是主动的,能够在你提出请求之前就提供建议;能够跨应用程序执行任务;能够随着时间推移而改进。这是因为Agent记住了你的活动,能够识别你的行为意图和模式。基于这些信息,Agent会提供它们认为你需要的东西,尽管最终决策始终由你来做。
想象一下,如果你想计划一次旅行。一个聊天机器人只能找到符合你预算的酒店,而一个Agent不仅知道你旅行的时间,还会基于对你需求的了解,例如你更想去新目的地或喜欢故地重游,给出建议的旅游地点。当被询问时,Agent也会根据你的兴趣和冒险倾向为你推荐可以做的事情,预订你喜欢的餐厅。而如果现在你想要这种深度个性化的旅游规划,你不仅要付费给旅行社,并花时间告诉旅行社你的需求。
02 Agent将如何影响四大领域?
Agent最激动人心的地方是它会让如今过于昂贵的服务变得平民化,例如医疗健康、教育、生产力、娱乐与购物等四个领域。
医疗健康
如今,人工智能在医疗保健领域主要是处理一些行政任务。例如,Abridge、Nuance DAX和Nabla Copilot可以在医生就诊期间帮助记录音频,并撰写笔记供医生审阅。
真正的转变将在Agent能够帮助患者进行基本分诊、就处理健康问题提供建议,并决定是否需要求诊时出现。
这些临床医生Agent还会帮助医护人员做出决策,提高工作效率。(例如,像Glass Health这样的应用程序可以分析患者摘要并为医生提出诊断建议。)贫困国家人民将尤其受益,因为那里的许多人根本没有机会看医生。
毕竟医疗事关生死,临床医生Agent的推广速度会比较慢。人们也需要看到医疗Agent总体是好的,尽管它们不完美无缺,也会犯错误。当然,人类也会犯错误。
目前,患者能否获得医疗保健也是一个问题。
如今,每周一次的心理治疗似乎是一种奢侈服务。但实际上仍有许多需求未得到满足,许多本可以从心理疗法中获益的患者却没有机会得到治疗。例如,RAND公司发现,在所有需要心理健康护理的美国退伍军人中,有一半没有得到治疗。
而训练有素的Agent将使心理疗法更加实惠、易获。例如,比起Wysa和Youper这两个早期聊天机器人,Agent的影响会更深入。只要你愿意和心理保健Agent分享足够的信息,它就会了解你的生活经历和人际关系。它会在你需要时出现,而且永远保持耐心。
在你允许的情况下,它还可以通过你的智能手表监测你的身体反应——比如当你和老板谈论问题时你的心脏是否开始加速跳动——并建议你什么时候应该去看人类心理治疗师。
教育
几十年来,我一直对软件给教师减负、帮学生学习的方方面面感到振奋。软件不会取代教师,但它会补充他们的工作——为学生提供个性化的服务,将教师从文书工作和其他任务中解放出来,让他们有更多时间从事最重要的工作。这些变化终于开始以戏剧性的方式发生了。
目前最先进的技术是Khan Academy创建的基于文本的机器人Khanmigo。它可以辅导学生的数学、科学和人文学科。例如,Khanmigo可以解二次方程式并创建数学问题,供学生练习。它还可以帮教师编教案。我一直以来都是Sal Khan的粉丝和支持者,最近他还参加了我的播客节目,谈论教育和人工智能。
但文本机器人只是第一阶段——Agent将开辟更多的学习机会。
例如,很少有家庭负担得起1v1家教。如果辅导Agent能捕捉到1v1家教的有用之处,它将为每个学生提供针对性指导。例如,当辅导Agent知道一个孩子喜欢Minecraft和Taylor Swift,它将用Minecraft来教学生计算几何的体积和面积,用Taylor Swif的歌词教他们讲故事和押韵。这种学习体验将更加丰富——例如,有图形和声音——而且比现在的文字辅导更加个性化。
生产力
这个领域的竞争已经进入了白热化。微软正在将Copilot作为Word、Excel、Outlook和其他服务的一部分。谷歌也在用Assistant with Bard和其生产力工具做类似的工作。这些类似Copilot的协助工具可以做很多事情,比如把书面文件变成幻灯片,用自然语言回答电子表格的问题,并从每个人的观点里总结邮件主题。
而Agent能做更多。拥有一个Agent就像有一个人专门帮你完成各种任务。如果你愿意,Agent也可以独立完成。如果你有一个商业想法,Agent会帮你写一份商业计划,创建一个演示文稿,甚至能生成产品的大概图像。公司会让员工直接咨询Agent,并参与每次会议,以便回答问题。
“如果你的朋友刚做了手术,Agent会提议送花并帮你订购。”
无论你是否在办公室工作,你的Agent都能像私人助理支持高管一样帮助你。如果你的朋友刚做了手术,Agent会提议送花并帮你订购。如果你想和以前的大学室友见面,Agent会和你大学室友们的Agents一起商量见面时间。就在你到达之前,它还会提醒你,他们最大的孩子刚刚在本地大学入学。
娱乐与购物
人工智能已经可以帮你挑选新电视,推荐电影、书籍、节目和播客。我投资的Likewise公司最近推出了Pix,它可以让你提问(“我喜欢罗伯特·雷德福的哪部电影,我可以在哪里看?”),然后根据你过去的喜好推荐电影。Spotify最近推出了一款人工智能DJ,不仅会根据你的喜好播放歌曲,还会与你交谈,甚至能叫出你的名字。
Agent不仅会提供建议,它们还将帮助你付诸行动。如果你想购买相机,你的Agent将为你阅读所有测评,总结后给出推荐,并在你决定后为你下单。如果你告诉Agent你想看《星球大战》,它会知道你是否已订阅了合适的流媒体服务。如果没有,它会主动为你注册。如果你不知道自己想看什么,它会给出定制化建议,然后想办法播放你选择的电影或节目。
你还可以获得根据你的兴趣量身定制的新闻和娱乐内容。CurioAI能就你提出的任何话题创建定制化播客,它是未来趋势的一个缩影。
03 Agent对科技行业带来何种冲击波?
简而言之,Agent几乎可以在任何活动和生活领域提供帮助,对软件行业和社会范围产生深远的影响。
在计算机行业,我们聊平台——应用程序和服务赖以构建的技术。Android、iOS和Windows都是平台。Agent将成为下一个平台。
“要创建一个新的应用程序或服务,你只需要告诉你的Agent你想要什么。”
要创建一个新的应用程序或服务,你不需要知道如何编写代码,如何做图形设计。你只要将需求告诉你的Agent。它就能编写代码,设计应用程序的界面外观,创建徽标,并将应用程序发布到在线商店。OpenAI本周发布的GPTs让我们得以一窥未来,非开发人员也可以轻松创建和分享他们自己的助手。
Agent将影响我们如何使用软件,如何编写软件。它们将取代搜索网站,因为它们更善于查找信息、汇总信息;它们将取代电商网站,因为它们将为你找到最优惠的价格,而不仅仅局限于少数供应商;它们将取代很多文字处理软件、电子表格和其他生产力应用程序。让如今分散的业务——搜索广告、带广告的社交网络、购物、生产力软件——整合为一项业务。
我不认为任何一家公司能垄断Agent业务——会有很多不同的人工智能引擎可供选择。今天,Agent被嵌入到其他软件中,如文字处理软件和电子表格,但最终它们将独立运行。尽管一些Agent可以免费使用(并拉到广告赞助),但我认为你将为大部分Agent付费,这意味着公司将有动机让Agent为你工作,而不是为广告商。如果从今年开始研究人工智能的公司数量,目测将会出现异常激烈的竞争,这会使Agent变得很便宜。
04 距离实现还有哪些技术挑战?
但在我所描述的复杂Agent成为现实之前,我们需要解决一些关于这项技术本身以及我们如何使用这项技术的问题。我之前已经谈到了人工智能引发的问题,所以在这里我将重点关注Agent。
目前还没有人知道Agent的数据结构是什么样的。为了创建私人Agent,我们需要一种新型的数据库,它可以细腻地捕捉你的兴趣和各种关系,并在保护隐私的同时快速检索信息。我们已经看到到了存储信息的新方式,例如向量数据库,它可能更适合存储机器学习模型生成的数据。
另一个未解决的问题是人们将与多少个Agent进行交互。你的个人Agent会与你的心理治疗师Agent和数学导师Agent分离吗?如果是这样的话,你希望它们何时彼此合作,何时保持各自独立?
“如果你的Agent需要与你联系,它将与你交谈或在你的手机上显示。”
你将如何与你的Agent互动呢?公司正在探索各种选择,包括应用程序、眼镜、吊坠、胸针,甚至是全息影像。所有这些都是可能性,但我认为在人与Agent的互动方面,首个重大突破将是耳机。如果你的Agent需要与你联系,它将与你交谈或在你的手机上显示信息(”你的航班延误了,你想等待还是需要帮助重新预订?”)。如果你愿意,它会监控进入你耳朵的声音,并通过屏蔽背景噪音、放大难以听清的语音、或让你更容易理解口音重的人说话来增强它的效果。
还有其他挑战。例如,目前还没有一个标准协议允许Agent们互相交谈;成本需要降低,让每个人都能负担;如何向Agent发出简单指令的同时得到正确回答;如何防止出现“幻觉”(即人工智能自信地给出了不符合事实的回答),尤其是在精确度要求极高的健康领域,还要确保Agent不会因为偏见而伤害人们。我们不希望Agent做它们不该做的事。(不过比起流氓Agent,我更担心人类罪犯利用Agent干坏事。)
05 隐私和其他重大问题
随着这一切的出现,网络隐私和安全问题将变得比现在更加紧迫。你会希望自己掌握Agent访问信息的权利,这样你就可以确信你的数据只与你选择的人和公司共享。
但是,你与Agent分享的数据归谁所有,如何确保数据被安全使用?毕竟没人想收到来自心理治疗师Agent的广告。执法机构能否使用你的Agent提交对你不利的证据?你的Agent何时会拒绝执行可能对你或他人有害的任务?是谁决定了Agent内置的价值观?
还有一个问题是,你的Agent应该分享多少信息。假设你想去看望一个朋友:如果你的Agent与他们的Agent交谈,你不希望它说:“哦,她周二要和其他朋友见面,不想邀请你。”如果你的Agent帮助你撰写工作邮件,它应该知道自己不该使用你的私人信息或上一份工作的专有数据。
很多问题已经成为科技行业和立法者关注的焦点。我最近与其他技术领导者一起参加了由参议员查克·舒默组织、许多美国参议员参加的人工智能论坛。我们分享了关于这些和其他问题的想法,并讨论了立法者制定强有力法律的必要性。
但有一些问题不会由公司和政府来决定。例如,Agent可能影响我们与朋友、家人的互动方式。今天,你可以通过记住他们生活的细节,比如他们的生日,来表达你对他们的关心。但当他们知道是你的Agent提醒你并负责送花时,这对他们来说还有意义吗?
在遥远的未来,Agent甚至可能迫使人类面对一些关于意义的深刻问题。想象一下,Agent变得如此优秀,以至于每个人都可以在不工作的情况下拥有高质量生活。在这样的未来,人们会如何利用他们的时间?当Agent知道所有问题的答案时,还会有人愿意接受教育吗?当大多数人都有很多空闲时间时,你能拥有一个安全繁荣的社会吗?
但我们离那个未来还很远。与此同时,Agent时代正在赶来。在接下来的几年里,它们将彻底改变我们的生活方式,无论是线上还是线下。
暂无评论内容