前不久被誉为“中国AI最高奖”的吴文俊人工智能科学技术奖正式颁发,在AI领域“卧薪尝胆”的京东一举拿下项目奖与个人奖,也是唯一一家双料获奖的企业。
“任务型智能对话交互关键技术及大规模产业应用”,我们从京东获奖的项目中略探到了京东发展产业AI之路的野望。
同样聚焦于智能对话交互,和GPT遥相呼应,核心均为基于深度学习的自然语言生成技术。而“大规模产业应用”的路径与GPT截然不同,将AI落地剑指产业,更直截了当地说,京东做的是生长在供应链上的产业AI。
但想让实体产业用上“好用”的AI,并非易事。
知识压缩,推动大模型落地产业大模型本质上是储存、利用并压缩知识的一种方式。
在BERT(2018年Google AI提出的一种预训练模型)以及更早的年代,我们很难想象能用模型参数来储存知识图谱。但随着BART、GPT-3等大模型的推出,模型参数逐渐扩大到和知识图谱规模相当,甚至更大。
其中储藏的海量知识,可以通过Prompt(提示词)被轻松提取出来,供大众进行查询、生成甚至执行复杂推理,实现更高的覆盖率和泛化能力。
ChatGPT之所以成功,是为“知识压缩”找对了路,完成了技术路线的拓荒。
作为一个通用模型,GPT已展现出了强大的能力,写小说、写新闻,聊聊天都不在话下,但其在垂直产业场景的应用价值尚未凸显。
究其原因,与其训练数据集脱不开关系。虽然至今OpenAI并没有公开训练ChatGPT的相关数据集来源和具体细节,但可以知道的是,大部分数据仍来源于广泛的开放域数据,包括互联网爬取网页, 书籍、维基百科、书籍、期刊、Reddit链接、Common Crawl和其他数据集,GPT-3的数据集大约预估达750GB左右。
以此基础上训练出的GPT,要在真实产业场景中落地应用,其准确度、实用度仍有提升空间。并且,在垂直产业场景中,面临着应用场景复杂、低频、长尾,项目定制化成本高昂,技术范式无法一劳永逸的多重难题。
AI落地是一个知易行难的过程,京东却从一开始就毅然选择更艰难的“产业GPT”之路,为手里丰富的产业“知识”开发相适配的大模型,这离不开京东持之以恒的技术路径——产业AI。
产业AI,供应链长出的独有优势京东的产业AI诞生于复杂供应链环节与产业场景,这也是其独有的差异化优势。
作为以供应链为核心的新型实体企业,京东集团拥有零售、物流、健康、工业等广泛实体应用场景,对外连接着金融、交通、能源等庞大而又复杂的产业生态,拥有全行业最完整的产业链和落地场景。
2009年,京东在江苏宿迁正式成立集约式客服中心。2012年,京东开始应用智能客服,着力于用AI技术辅助客服提升人效,优化客户体验。2018年,随着何晓冬等一大批顶尖科学家加入,京东开始赋予智能客服更多智慧乃至情感。2年后便推出了业内首个大规模商用情感智能客服系统 ——“言犀”,在大规模服务场景中沉淀AI能力。
自诞生之际,言犀便自带“产业”属性,技术可用性强、复用度高、迁移成本低。目前,言犀每日与用户进行1000万智能交互,支持辅助20000 客服坐席,累计服务数十万商家,5.8亿终端消费者,是放眼全球范围内最大的智能对话场景之一,也成为了探索智能对话交互技术产业落地的前沿阵地。
在数十年深耕供应链的实践中,京东逐渐积累了一批优质、动态的产业“知识库”,给“产业版GPT”提供了肥沃的生长土壤。
实践不仅能创造价值,还是技术的“试金石”,且不断反哺技术。不同于普通闲聊对话场景,京东云言犀更聚焦于任务型对话交互,以解决真实世界深度复杂的任务为目的。在用户与客服对话中,通常带有明确的目的指向,AI技术需完美解决客户售前售后咨询、价保、交易、支付、配送、退换货服务等各环节需求。为此,言犀沉淀了4层知识体系、40多个独立子系统、3000多个意图以及3000万个高质量问答知识点,覆盖超过1000万种自营商品的电商知识图谱,用以提升任务型对话技术能力,保障可用、可控、可信的智能对话体验。
京东云言犀团队陈蒙博士提到,京东应用场景非常丰富,在模型的泛化能力上也有一定的技术优势。比如最开始去做零售领域的售后环节,不但有几千种品类,而且每个店铺卖的东西又不一样,技术团队在实操中解决了许多模型泛化性的困难。未来,言犀大模型从零售领域,拓展到政务、金融、交通等领域的时候,又会给模型提出更高的泛化性挑战,而之前积累的技术又可以复用,不断迭代优化。
以最常见的外呼为例。对话是不是流畅,机器人是不是存在“看似很逼真,但还是无法理解我的意思”的问题,就涉及解决口语流畅性和话语决策性、音素鲁棒性的问题。而往往,用户的问题并不是一个,这还要求能够支持多轮对话的能力,这又涉及到上下文建模的问题,需要AI能够结合上下文进行问题补全和指代消解。过去一年,言犀AI外呼共计与用户交互了4.3亿人次。
在零售、金融、物流、制造等行业场景中不断磨练,言犀相当于每天都在做千万次图灵测试,而每一次测试,都会为AI带来点滴新的进步。
决战大模型:走向多模态与实体京东云今年将发布的新一代产业大模型 ——言犀大规模预训练语言模型,被视为是AI角逐产业场景的开端。
京东云言犀团队前后耗费多年时间,持续深耕对话式AI、生成式AI,与大模型技术的迭代与升级。在清晰技术路径的指引下,京东云言犀和京东探索研究院打造了支持京东的技术、服务产业的技术、探索未来的技术。形成了数据、技术、产品的飞轮,相互协作,互为促进。
京东对于大模型的技术积累不是一日之功。在此之前,于2019年发布的自研领域模型K-PLUG,已经可以实现给定商品的SKU自动生成包括商品标题、商品卖点和商品直播脚本等文案,目前覆盖了2000多个商品品类,生成超30亿字,带动3亿元GMV。
在通用语言理解基础模型方面,京东探索研究院提出的百亿级织女大模型也已再升级,提出规模更大、性能更强、迁移性更好的Vega v2模型。能够广泛应用于情感分析、语义匹配、语法纠错、智能问答、常识推理等多种下游自然语言处理任务。在国际权威的复杂语言理解任务评测SuperGLUE榜单上,Vega v2模型以平均分91.3的成绩登顶全球榜首,超越Google、微软、Facebook、OpenAI等国际顶尖机构。
此前提到,此次吴文俊人工智能科学技术奖京东是唯一一家双料获奖企业,除项目奖外,个人杰出贡献奖则由京东科技智能服务与产品部负责人何晓冬博士斩获。
对于目前的大模型热,何晓冬谈道:“目前大家说的大模型比较多的是语言模型,但语音、文本、图像等不同模态,已形成包括多模态数字人、艺术创作在内的多种应用,可以看到大模型理念和技术正在迅速地向多模态扩展。”京东云也正持续训练模型的泛化能力,走向多模态。
智能政务热线便是其中一个例子。
任何一个大中型城市,每天都需要面对上万次繁杂的居民电话咨询,从政策咨询到投诉建议,无所不有。传统政务热线话务员坐席数量不足,无法对激增的市民需求实现“秒级”快速响应。此外,数据也仅仅停留在汇总阶段,未实现有用的数据分析。而从政务热线智能化趋势来看,在业务系统构建后,势必需经历单场景应用智能化以及业务全领域应用智能化,最后达到热线社会价值最大化,包括协同跨职能、跨部门、跨区域的管理部门,构建从感知到防范,从诉求到处置的线上线下联动机制等。
数据统计显示,2022年,东莞12345全年话务受理量从270万通升至581万通。与之相对的是,接通率由40%升至超90%,工单平均办理时长由12.6天压至4.3天。效率的提升即是因为京东云智能在线机器人、智能知识库、智能坐席辅助、智能外呼、智能质检、语音语义中台等一系列智能产品的引入。
全AI生成的数字人主播也是多模态的典型落地应用。
言犀虚拟主播集京东云全栈AIGC技术之大成。通过AI驱动,拥有多变的形象、媲美真人声音、丰富的电商知识积累,在4000余个品牌直播间与观众流畅交互,广泛服务3C家电、美妆、母婴、宠物、家居等品类店铺,已为联想、坚果、伊利等多家知名品牌提供数字人主播服务,累计带货超6亿元,但虚拟主播一年的成本却不到真人的十分之一。
“如今,所有人都在面对一场彻底的技术变革,必须非常严肃地对待。”在何晓冬眼里,ChatGPT掀起的新AI革命,京东从上至下都已行动起来,包括跨部门项目组、推动模型进步以及产业落地。
敢于扎根复杂的产业场景,开发面向产业的多模态大模型,京东云背后扎实的产业应用实践和厚积薄发的技术团队是坚韧的底气。
技术的进步,让京东看见了更远的产业AI前景,这里面也包含着无数的难题,如何让整个产业价值得到真正的闭环,在落地过程中将会有大量的问题进一步涌现。
但在京东内部极其清楚,产业AI的价值是让每一个企业扎实地看到效果、享受到价值,这是检验成功的唯一标准。
结语数年来,公众对人工智能的争论和关切,焦点多在通用人工智能(AGI)的实现上。
在可预见的未来,人工智能的技术应用与“宏伟梦想”可能仍存在距离。但正如我们在前面讨论的那样,产业AI或许才是通向人工智能的终局之路。
正如每次人类获取信息的跃迁,都伴随着巨大的商业机会。在这波GPT技术变革中,不妨看下京东云这片“产业竹林”如何展开,又会有哪些产品与应用在上面像竹笋般长大,成长为茂密的竹林。
,