7月12日,全球领先的人工智能小冰框架与Vsinger达成合作,探索虚拟歌手向AI being迁移的路径,启动了专为虚拟歌手洛天依定制的歌声、语音多个AI声库的制作企划,展示了由小冰深度神经网络歌唱模型(Xiaoice DNN Singing Model)驱动的洛天依。
作为数字新物种,虚拟歌手正朝着人工智能驱动的AI being迁移。在洛天依十周年生日会直播现场,洛天依首次用AI发声:“唱出你心中的歌,我是虚拟歌手洛天依。”并同时宣布,以小冰框架定制的洛天依AI,和X Studio音乐创作软件制作企划正式启动,其中包括洛天依的歌声合成声库,和第一个语音声库,将向广大创作者们推出。
生日会口播视频片段
与此同时,在为期一个半月的洛天依十周年线下展的现场,参观者将体验到基于人工智能小冰框架驱动的AI洛天依的歌声,并能参与到内测版小冰X Studio音乐创作软件与洛天依AI声库的测试中。未来,洛天依AI声库与X Studio正式上线后,将兼容MacOS和Windows平台、支持多种唱法参数调节、AI一键调参等新功能,界面设计和交互体验也更贴合专业用户的习惯,这将让基于洛天依IP的音乐创作,更加便利和顺畅,也拥有更多声音表现的可能性。
更好的体验离不开技术创新。自2016年以来,小冰团队以DNN为技术基础,持续探索和拓宽人工智能歌唱的上限与边界。基于双方合作,小冰团队率先在洛天依AI声库,通过优化后的小样本学习,就能够完成音色融合、唱法迁移、高品质歌声合成。优化后的小样本学习,是指新模型仅需25首歌曲作为训练基数,就可以达到85%或MOS 4.25以上的声音还原度;音色融合,是指在给定的音色基础上,可更精细的构建声库和调参,创造出无数个质量相同,但音色不同的虚拟歌手;唱法迁移,是指将音频中的音色和唱法信息分离,实现训练好一种唱法模型,就可以快速迁移到任意虚拟歌手身上。这些技术创新,能让小冰框架快速训练出无限个各具特色的高品质虚拟歌手。
未来每个人身边,都将环绕着许多个虚拟人。多年之后回望,小冰框架与Vsinger双向奔赴的一小步,将是AI驱动的虚拟歌手,加速进入大众日常生活的一大步。