AI来抢编剧饭碗了?这个AI用GPT-2写的剧本,预计2021年1月首播

查尔斯大学、Švanda剧院和布拉格表演艺术学院的研究人员目前正在进行一个有趣的研究项目,将人工智能和机器人技术与戏剧相融合。他们项目的主要目标是利用人工智能创造一个创新的戏剧表演,预计将于2021年1月首演。

“我们研究背后的主要想法来自TomášStudeník,他是一位创新者,他注意到戏剧剧本RUR的100周年纪念日即将到来,”进行这项研究的研究人员之一鲁道夫·罗沙(Rudolf Rosa)说。

“这对机器人技术来说是一个关键的时刻,因为机器人的概念,包括“机器人”这个词本身,是由卡雷尔·恰佩克(KarelČapek)和他的兄弟约瑟夫(Josef)发明的,他写了这个剧本。汤玛士认为应该好好庆祝一下,于是就产生了把故事反转过来的想法:100年前,一个人写了一部关于机器人的戏剧,如果今天,机器人写了一部关于人类的戏剧呢?”

在开始研究他们的项目之前,研究人员回顾了以前的文献,探索人工智能技术在诗歌、音乐、绘画或其他艺术形式的创作中的潜力。虽然现在有大量的论文关注机器生成的艺术,在一些论文中,运算技术被用于制作戏剧剧本的对话或故事创意,但是自动产生整个戏剧表演是一项非常复杂的任务,以前很少有人尝试。

罗沙和他的同事们决定将他们的剧本分成几个小部分。他们的计划是使用一种被称为“分层产生”的方法,就是把大量文本的生成分割成可控的小部分。虽然其他研究团队在过去使用这种方法来产生对话、剧本或其他文本,但很少有人尝试使用这种方法来制作整个剧本。

“由于周年纪念日的临近,我们的主要目标很明确,也很坚定:在2021年1月之前,我们需要有一部已准备好首演的戏剧。”罗沙解释道。“由于将由专业剧团演出,我们需要在9月份准备好剧本,这样就有足够的时间戏剧化、彩排等。因此,尽管我们正在开发一个通用的戏剧剧本产生工具,但目前我们真正需要产生的只是一个剧本。”

到目前为止,研究人员用的是GPT-2的语言模型进行训练。这是一个由OpenAI联盟开发的开源模型,并在大量的线上英语文本上进行了训练。他们测试的第一批结果被简述在arXiv上预先发布的一篇论文中。

Rudolf Rosa

GPT-2是一个生成式语言模型,这意味着当经过充分训练后,它可以使用相似的语言完成未完成的文本,并涵盖相关主题。例如,如果给它输入一篇新闻文章的第一段,该模型就会尝试生成关于同一主题的另外几段,将现有文本作为灵感来源,但也会产生关于新概念的句子。

“当我们向GPT-2输入一个场景设置和几句戏剧剧本时,它就会以同样的风格生成进一步的台词,并专注于输入剧本块的主题,”罗沙解释道。“这样一来,我们不需要训练任何东西(目前),因为我们对生成器做了一点限制,让它专注在自己的任务上,不偏离到其他地方。因此,我们可以利用在巨量文本上训练了很长时间的巨大的GPT-2模型,我们自己没有能力在我们的硬件上进行训练,因为现在只有最大的技术公司才能训练这样的模型。”

虽然研究人员使用预先训练的GPT-2模型进行的实验取得了可喜的结果。但是事实上,他们没有对该模型进行改编,也没有对戏剧剧本进行专门训练,这使得控制其操作和性能变得更加困难。

该项目工作团队

“我们也明确地与“人机循环”(Human-in-the-loop)概念合作,”罗沙说。“基本上,所有计算机生成的“艺术”都会以某种方式被人类触碰和修饰,但这往往不是很透明。在我们的工作中,我们试图非常明确机器做什么,人类做什么,让他们的合作成为系统设计的一个组成部分,而不是一种事后的修补。”

目前,罗沙和他的同事们通过回顾以前的作品,试图找出制作戏剧剧本最有效的方法来启动他们的项目。虽然他们已经决定了要使用什么方法,但他们才刚刚开始将其运用到戏剧剧本的创作中。

罗沙说:“我们的项目仍处于起步阶段,但我们对采用预训练的GPT-2模型的基本方法的效果感到惊讶。”

“我们只给它输入剧本中的几句台词,它就能接收到它的体裁、结构、主题和人物名称,利用这些消息生成就能或多或少的生成一些合理的台词。这是在没有任何改编或微调的情况下实现的:我们只是使用了网络上可以下载的模型,这说明GPT-2模型确实相当强大。”

 

产生的脚本样本。前6行是来自原始的R.U.R.脚本,并作为产生器的输入,其余的由预先训练的GPT-2模型生成。

目前,罗沙和他的同事们还在尝试所谓的“平面文本产生”,即由机器学习模型为剧本单独生成台词,一次一行。不过,他们很快就想开始使用分层生成方法来创建剧本的简要摘要,并将其扩展为详细的大纲,最后将这个大纲翻译成对话。理想情况下,他们计划使用的模型将生成一个既连贯又有效的剧本,既遵循一条共同的线索,又能创造出背后有明确含义的文本。

“我们还需要确保产生的剧本是连贯的,不会重复或自相矛盾,不会过于频繁地引入新的随机角色,以及一些小而有趣的事情,比如防止角色离开现场但继续说话的情况。”罗沙说。“我们的第一部戏应该会在2021年1月首演。我们会看看它的进展情况以及接受度如何,然后希望我们的观察能推动我们进一步的研究和发展。”

A robot writing a script. Credit: Rosa et al

在现阶段的研究中,罗沙和他的同事仍然认为,机器人参加他们的戏剧需要大量的人类监管。但在未来,他们希望制作出一个完全可以由机器人来表演的剧本,而不需要任何人类表演者或人类指导。