当前,广州正加快构建“12218”现代化产业体系,把“人工智能”定位为战略先导产业,深入开展“人工智能+”行动,推动人工智能在多个领域创新应用,赋能千行百业。 4月7日,趣丸科技首款搭载SOTA模型的AI语音应用——趣丸千音开启邀测。 ![]() 作为全球领先的AI语音创作平台,趣丸千音旨在提供一站式智能语音解决方案。平台集成文本转语音、视频翻译、多语种合成等能力,是业界首个从模型到应用全面赶超国际先进水平的AI语音产品,适用于影视动漫、有声读物、新闻传媒、文旅导览等多个行业,全流程革新内容创作与国际传播,为用户带来前所未有的沉浸式体验。 据悉,这是继趣丸科技去年发布AI音乐产品“天谱乐”后的又一个全球领先AI应用。天谱乐是全球首个多模态音乐生成大模型,曾斩获第三届琶洲算法大赛全球总冠军。 在MaskGCT模型能力支持下,趣丸千音在语音相似度、准确率、质量和稳定性上均领先于同类产品,同时支持支持中文、英语、日语、法语、德语、韩语等多语种生成,能够提供全球化的语音输出。 MaskGCT是趣丸科技与香港中文大学联合研发的开源语音大模型,采用掩码生成模型与语音表征解耦编码的创新范式,曾登顶GitHub趋势榜榜首,被业界誉为“最强AI语音模型”。该模型在全球最大且最为多样的高质量多语种语音数据集之一“Emilia”上进行训练,展现出超自然的风格迁移及跨语言生成能力。实验表明,模型在多个TTS基准数据集上都达到了SOTA效果,超过当前最先进的同类模型,某些指标甚至超过人类水平。 目前,趣丸千音在影视动漫、有声读物、新闻传媒、文旅导览、在线教育等领域应用场景广阔。这种“小切口大机会”的逻辑,与特斯拉用Model S打开电动车市场异曲同工:先用极致效率攻克一个高需求场景,再以标准化能力横向吞噬百亿市场。据《2024全球数字内容产业报告》,仅媒体与泛娱乐领域的多语言翻译需求规模已超650亿美元,而趣丸千音正成为这条赛道的核心基建。 以微短剧应用场景为例,作为中国文化出海“新三样”,微短剧正在海外刮起强劲“中国风”。国家广播电视总局国际合作司公布的数据显示,中国微短剧海外应用已突破300款,全球累计下载量逾4.7亿次;中国微短剧产品已覆盖全球200余个国家和地区。 短剧出海的爆发,也让译制剧加速成为出海内容的主体。而传统人工译制流程周期长、成本高昂正成为制约短剧作品“走出去”的一大瓶颈。目前,趣丸千音的视频翻译功能可实现12小时译制1000分钟剧集,效率较人工提升10倍+,成本下降15倍+,让译制行业在AI赋能下迈入工业化量产新纪元,为中国优秀作品按下出海“倍速键”。这组数据背后,不仅让支持45分钟单次上传的ElevenLabs望尘莫及,也是工业化能力对实验室原型的降维打击。 目前广州市正按市委、市政府工作部署成立产业办,专门推进人工智能相关工作。通过为各类创新主体搭建便捷、优质、普惠的AI+行业应用共性技术服务基地,集聚各类产业生态合作伙伴,大力推动AI+行业应用加速在广州落地,通过鼓励应用示范,带动人工智能技术产业化和产业发展智能化。 |
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。