RetroArch通过文本识别系统,为怀旧RPG游戏加上语音

以开源、免费使用为特色的万用仿真器RetroArch集合了许多社群开发者的力量,在功能与仿真还原度等层面都有相当出色的表现。这次官方分享的开发中进度是通过文本识别系统(OCR)自动识别RPG游戏中的对话字幕,并通过语音引擎将文本数据念出来,让游戏也有“真人配音”。

在RetroArch开发团队所展示的视频中,他们使用任天堂Super Famicom平台的《创世封魔录》(Soul Blazer)进行示范。

当游戏进行遇到文本字幕时,玩家可以将仿真器切换至暂停,然后系统就会自动侦测文本的范围,并通过文本识别系统解读画面上的文本,之后会将解读取来的数据送至语音引擎,待玩家解除暂停之后,系统就会将圈选的文本念给玩家听。

开发团队强调这只是开发中的进度展示,不代表最终功能的使用体验。这也暗示着正式版功能可能会强化识别的速度与流程,进而在不影响游戏流畅度的前提下使用这个功能。

从视频中可以发现识别过程不是很流畅,但应该会在正式版大幅改近。

这个技术的核心在于侦测文本范围以及文本识别系统,如果在未来能够将识别过后的文本先输入翻译软件,然后再以语音念出,搞不好还能将从来没有推行过中文版的游戏,变成有“狂新闻”风格中文语音的版本哦。