你爱玩剧本杀吗?
有一个好消息是,再也不用为凑不够队友而发愁了;坏消息是,你再也摸不透、看不穿你的队友了——因为有人借助浪潮信息推出的源1.0模型训练出可以在剧本杀里扮演角色的AI了。
“我第一次玩剧本杀,没想到是和AI一起,我感觉自己不是很入戏,但是这个蔡晓(AI)比我还入戏。在剧情中我的角色是个‘墙头草’,属于被争取票,这个蔡晓太主动了,让我有点招架不住。频繁的向我示好,然后像一个小女生一样和我谈她的梦想,整得我都不好意思拒绝。”一位真人玩家“孔墨”这样说。
以剧本杀这个设定的场景来应用“预训练大模型”AI带给了开发者和玩家们惊喜和意外。没有十全十美的技术,但技术打开了通往新世界的大门。
这道门会通向未来的元宇宙么?
剧本杀里的训练
教AI玩剧本杀的创意来自6位隔离在上海的编程爱好者,他们来自上海交通大学、华东理工大学还有从事VRAR方面的业界人士。
毕竟是训练AI,剧本还是经过了特别改编,选择了有五个角色的微型线上剧本杀。每场召集四个真人玩家,并在他们不知情的情况下,由AI扮演分配剩下的角色。
“本着细节拉满的原则,我们也为AI准备了一个微信账号,并精心为她设定了昵称和头像,甚至每场游戏前我们还会紧扣时事,为她准备近三天的朋友圈内容,游戏后还会继续连发三天朋友圈内容提供延展剧情。”开发者说。
这样的AI陪玩可谓诚意满满,当玩家们得知自己和AI玩了一场剧本杀时都有些错愕。毕竟,当玩家对AI的角色进行表白时,她的表现绝对是一位忠贞的女友,毫不犹豫派发“好人卡”:我们是最好的朋友。
开发周期虽然是短短的一个月左右,迭代可是每天都要进行的。开发者使用了浪潮源1.0,是一种生成式预训练模型,也是目前世界上最大的单体中文NLP大模型。源1.0擅长的是零样本(Zero-Shot)和小样本(Few-Shot)学习,而非目前更多模型所擅长的微调试学习(finetune)。
如果用一串专业性的数据来描述,源1.0开放API使用的是Language Model(LM)模型结构,参数规模高达2457亿,训练采用的中文数据集达5000GB,相比GPT-3模型1750亿参数量和570GB训练数据集,“源1.0”参数规模领先40%,训练数据集规模领先近10倍。
小样本的好处在于2~3个,甚至1个合适example的示范下,模型可以很好地理解开发者希望实现的“对话策略”,仿佛具有“举一反三”的能力。开发者把AI比作天资聪慧的张无忌,但是如果他碰到的不是世外高人,而是凡夫俗子,每天演示的就是如何上班摸鱼、上课溜号是绝无可能练出九阳神功的。“源1.0模型也是这样,虽然它背了5.02TB的中文数据,差不多相当于500多万本书了,但是它也没玩过剧本杀,能做的就是模拟和有样学样。”
AI需要根据剧情对不同角色采用不同而回答策略,“example语料库”被分装成4个TXT文件,程序会根据提问者去对应选择example来源。不过,在实际游戏中,玩家可能的提问措辞是无穷无尽的。开发者还用到了百度飞桨发布的预训练模型——simnet_bow,能够自动计算短语相似度,而且运算速度快,显存占用低。
可见训练一个成功的AI也需要博采所长。决定采用哪一款开源模型也要受到如模型特性、API是否足够方便使用等诸多因素影响。“浪潮的工程支持还是很到位的,所以开发门槛其实没那么高。API的相关接口给的很全。我其实不是专业程序员,稍微摸索一下都能够用起来,我觉得可以再进一步做成PaaS平台,服务更多人。”开发者告诉第一财经,团队对浪潮针对prompt生成、request提交以及reply查询给出的范本代码评价极高,表示“好到了我们直接拿来用的程度”。
为元宇宙“注入灵魂”
AI玩剧本杀是一次限定场景下紧密结合自然语言生成与自然语言理解的应用,也是虚拟人在“好看的皮囊”之外生成“有趣灵魂”的一次尝试。
NLP领域在生成式预训练大模型方面已经取得了长足进展,但是智能客服还难言智能,陪伴型的服务机器人比如智能音箱类产品还是会愉快地和主人顶嘴。
“对话有两种,一种是开放语境,就是完全不受限制的。这种对AI的最低要求是说人话,但是对逻辑性、对上下文的理解和所谓的目标性是没有要求的,这种很难有现实价值,如果是目标性对话,传统的做法就不太能满足需求。”
AI剧本杀的开发者想要做点改变,引入了“端到端”的做法。“我们也发现AI如果不记忆自己之前的答案,后续生成的结果会比较缺乏连续性,甚至给出前后矛盾的回答。这些问题迫使我们决定增加‘多轮对话记忆机制’。” 在合适的 example的引导下,甚至能够体现出一定的情商,增加了情绪化的表达。
开发者提供示例
“也不是说是每次AI都会这样,是有随机性的。举这个例子说明大模型的生成机制下,它会表现的不仅说人话了,还会带一点人味,这个都是新特性,很有意思的新特性。”开发者告诉第一财经。
此外,就如人类在日常生活中也不会记住所有事情,没有“注意力机制”的“记忆机制”其实对于对话AI来说是弊大于利的。然而,如果要引入“注意力机制”,那就要增加更加复杂的NLU(自然语言理解)算法。好在剧本杀的实际应用场景更多关注当前轮次的对话,对于需要遥远轮次对话内容回答的情况,AI可以托言“忘记了”。
“对于我个人来讲的话,现在对AI的研究和应用完全是兴趣状态,接下来我们可能会跟高校和文娱业内的一些专业人士有一些课题上的研究合作。”AI当然可以陪人类一起玩剧本杀,但是还有更多的可能性等待探索。