8 月 3 日,eNet研究院,德本咨询和《互联网周刊》共同评选并发布了“2020人工智能语义识别创新排行”榜单,标贝科技凭借自主创新打造的AI歌曲合成解决方案成功入选,体现出自身语音技术实力和解决方案服务能力受行业机构广泛认可。其中,与标贝一同入选的还包括百度、阿里、腾讯、小米等厂商,对应各家重点的语音产品服务。
(图片来源:互联网周刊)
AI技术的不断进步,让智能语音从单一商业模式向多元化商业模式的变迁,技术输出的“厚度”增加,“边界”扩大,也带来了技术落地曲线的加速度增加。根据统计数据预测,2021年我国智能语音产业市场规模将突破100亿元,在未来的几年内将依旧保持高速增长。
而AI合成歌曲,作为语音技术生成应用延展体现,可针对虚拟偶像、虚拟歌姬、泛娱乐、智能硬件等场景,为客户提供个性化语音解决方案,增强用户交互体验。
事实上,常见的歌曲合成软件,会涉及到声音的波形、包络和频率,为了让歌曲听起来更接近人声,需要人工调节包络和频率,还需要用不同的合成方法进行对比优化,并且波形调节难度更高,即使经验再资深的调教师输出的作品,也会有明显的机械痕迹。整体来说在操作使用、合成速度、应用效果等方面均有不足之处。
作为在智能语义场景下的创新应用,标贝科技打造的AI歌曲合成技术解决方案,采用AI神经网络技术,可以自动化的对歌手声音的参数进行调整,比如:节奏、和声、力度、速度、调式等歌曲生成的重要参数。一站式的歌曲合成,让用户可以直接使用已训练好的歌手声音模型,无需更多的人工干预,输入固定格式的乐谱即可合成想要的音乐,在合成效率和合成效果方面较歌曲合成软件有显著改善。
标贝语音技术负责人介绍,该方案主要面向大众用户,旨在提供娱乐化、个性化的使用体验,借助 AI歌曲合成的歌声不仅可以做到让采样原声还原度很高,而且歌声接近真人的歌唱水平,真实自然、优美动听。
动听的旋律、美妙合成歌声背后是强大的语音技术和歌曲数据支持。标贝科技拥有完整的采标一体化解决方案,能够实现快速产出高质量的不同音色、风格类型的的AI数据。目前标贝科技语音数据规模总时长超过10万小时, 40余种明星IP音库,20余种歌曲音库;近百种合成定制库,包括中美儿童/男女声、粤语/台语/韩语/日语/方言男女声、智能客服、前端训练集等;识别自有库超过50种,包括成人、青少年/儿童、地方方言及小语种等。
随着语音技术不断发展,技术与用户的关系将变得更加紧密,而AI歌曲合成的空间也随之加大。标贝科技将加大技术创新投入,推出更多优质语音交互解决方案,与行业伙伴携手推动行业快速发展。