安卓中文网 > 正文
出门问问携手光明日报发布推出AI虚拟主播
出门问问携手光明日报发布推出AI虚拟主播
来源: 原创 作者: 刘文轩 2020-09-07 16:26
出门问问携手光明日报发布推出AI虚拟主播。

由商务部和北京市人民政府共同主办的2020年中国国际服务贸易交易会于9月5到9日在北京举办,主题为“全球服务,互惠共享”。
在文博服贸会期间,中国人工智能公司出门问问携手中央级党政媒体光明日报,联合发布全新魔音系列产品:AI虚拟主播——“魔影主播”,AI音频内容生产一站式解决方案——“魔音工坊”,并展开相关深度合作。双方合作成果在文博会展厅对外展出,以此积极推动媒体融合向纵深发展,实现传统媒体向智媒体转型的技术升级。
发布会上,双方还重磅带来全新定制的虚拟主播,让来自新闻产业、出版行业等更多传统内容创作者,共享AI乐趣。

展会期间,北京市委书记蔡奇,中共北京市委常委、宣传部部长杜飞进,光明日报社等一行领导,先后莅临光明日报展厅参观。对本次光明日报与出门问问联手打造的AI虚拟主播表示了肯定,认为其对提高传统媒体内容生产效率具备一定积极意义。
同时,市领导与报社高层对出门问问展出的智能硬件产品,包括AI智能手表TicWatch系列、AI真无线智能耳机TicPods系列、智能音箱TicKasa系列等,也展现出了浓厚兴趣。正是凭借在消费级场景积累的AI能力和经验,出门问问如今成功向To B企业级场景延伸。

光明日报报社高层参观出门问问展台

在人工智能技术落地、云计算普及、大数据应用等新技术的驱动下,人们颠覆了对传统媒体的固有概念,传媒领域也由旧格局转向融合发展,并逐步迈入智媒体化的全新阶段。
出门问问认为,媒体形态之间,不仅可以实现融合,而且还可以通过技术实现相互转换。为了帮助传统媒体更好地适应音频和视频形态,多渠道分发,出门问问通过能够将文字升级为音频的“魔音工坊”,公众号变身podcast的“魔音号”,以及文字转换为视频的魔影主播,让优质内容触达到更多用户,实现内容价值最大化。
在这场信息传播的深度变革中,人机协同将扮演重要角色。出门问问致力于将媒体人的专业优势和AI的高效智能生产完美结合,让人做人擅长的事,机器做机器擅长的事。

为此,出门问问高级技术总监叶顺平在服贸会期间发表了以《语音AI:媒体融合与转换的桥梁》为主题的演讲。针对传统媒体融入新媒体所遇的痛点与挑战,详细阐述了出门问问如何通过魔影主播、魔音工坊以及TicMeet等产品,借助人工智能技术为传统媒体实现融合与智能化搭建桥梁。
为了实现传统文字内容与影、音的形式之间高效灵活的转换,出门问问主导研发了全新产品“AI虚拟主播——魔影主播”,可通过语音驱动虚拟形象说话及反馈动作。
该技术将深度学习和计算机图形学结合,让计算机能够理解语音的内容并精细驱动虚拟形象的口唇动作、面部表情、肢体姿态,生成极具逼真感的虚拟形象动画。结合TTS技术,能够为客户提供具备丰富表情动作反馈的AI虚拟互动助手。编辑人员仅需输入文字内容,即可快速生成具备同步口型、丰富面部表情及模型动作的AI虚拟主播视频。

相比真人主播,AI虚拟主播具备一系列优势:
实时语音解析
准确解析语音音频中信息,转化成可以驱动虚拟形象的音频特征。
精准口型驱动
采用深度学习模型,准确映射音频特征到口型以及面部动画。
动作姿态驱动
具备成熟的骨骼和动作制作规范,通过语音内容驱动模型头部动作及身体动作。
领先的音频编辑功能
该系统结合了魔音工坊配音产品的核心产品功能,可以完成多音字和韵律的快速纠正,使得生成的配音足够准确专业,更适合虚拟主播等场景。
除了魔影主播,魔音工坊同样也是出门问问与光明日报此次合作的重点。
魔音工坊是出门问问此前出品的一款主打AI音频生产的产品, 公司旨在以AI助力音频内容创作,通过独创的产品和交互,成为AI音频内容生产一站式解决方案,打造AI音频时代的WORD编辑器。
利用领先的端到端MeetVoice语音合成引擎,魔音工坊独创性地设计了交互友好的产品形态,用户可以快速导入要合成声音的文章,通过类似微软WORD文档的编辑操作,即可快速解决拼音、韵律等中文配音问题,让用户一站式快捷生产出专业精品的音频。
魔音工坊不仅能够提供定制发音人、纠正多音字、背景音和音效、多发音人配音等核心功能,还具备数字纠错、变速、韵律纠错、创建个性「随身听」微信小程序等各种便捷有效的工具。

不只是光明日报,魔音工坊如今已为众多头部媒体提供随身听小程序,将文字内容升级为更有深度和感染力的声音形态。提升自媒体用户体验,让粉丝用户留存、时长和长期忠诚度、活跃度得到更大提升。
出门问问能够获得光明日报与众多头部媒体的青睐,关键在于公司在人工智能的基础层、技术层、应用层都有着深厚积累与大量实践案例。
在本次全新发布的魔影主播与魔音工坊两款产品背后,是出门问问自主研发的全CPU低时延端到端语音合成系统MeetVoice (Mobvoi End-to-End TTS Voice) 。其采用基于神经网络的声码器 Meet-Vocoder,可以实现高度接近真人的声音素质。

出门问问使用多发音人基础模型,提升语音合成效果,汉字发音准确率提升至99.6%以上,保持业界领先水平。在此基础上,MeetVoice最大限度地提高效率,1秒时间能够合成近10秒音频,且无需额外配置GPU。借助此次与光明日报的合作,出门问问也将持续迭代升级语音技术,用AI为人工降本增效、赋能新闻媒体行业。