4月21日,世界读书日前夕,AI超拟真有声书《智能交通》在喜马拉雅APP上线。这部音频作品基于百度董事长兼CEO李彦宏所作《智能交通》一书,使用李彦宏约300句公开语音数据,通过AIGC(AI自动生成内容)技术创作生成。其音频合成效果还原度几近原声,普通用户基本无法区分真人声音与合成声音。
《智能交通》有声书共分86集,首日上线21集,后续每天更新2集,用户在百度搜索智能交通有声书可直接收听。从20万字专业文本到超拟真音频作品,《智能交通》有声书成功创作的背后是百度在语音合成技术上的领先优势。目前,只需9句话素材、5分钟等待,百度语音合成技术即可实现对用户声音的复刻,300句话即可生成媲美专业音库的音频内容。
作为业内唯一能提供10句话以内大规模产品级个性化语音合成服务的公司,百度相关技术早已应用于各类产品中,如在百度地图吸引超过600位明星红人入驻语音广场,实现个性化定制语音包,每日播放次数达2亿。
《智能交通》有声书内容来自李彦宏所作《智能交通:影响人类未来10—40年的重大变革》一书,这是国内首部系统阐述中国智能交通发展现状和前景的专著。该书认为,我国有着领先的科技人才红利,有着丰富的人工智能应用场景,有着无可比拟的良好政策环境,智能交通建设必将走在世界前列。未来,由新技术、新理念、新模式构建的智能交通系统,将有望降低90%交通安全事故;10年之内,依托交通效率提升,城市拥堵问题将基本解决;随着共享无人车的普及,私家车的需求量将大幅降低。
数字时代,内容生产的需求持续提升。以TTS技术(Text to speech,语音合成)为代表的AIGC(AI generated content,AI自动生成内容)已成为一种新兴的内容生产方式。这一方式具体包括通过AI生成创意(如主题、构思等)、生成素材(如文字、配图、配音等),以自动编排合成的方式最终生产出内容。未来,可能只需要几秒钟时间,就能生成以往花费几天时间和精力才能创作出的内容。这不仅是简单的效率提升,还将打开更多可能性,激发出人类不曾有过的创作思路、创意认知。
AIGC的应用发展有赖于AI全栈技术能力的支撑。作为国内AI领域的领军者,百度布局人工智能已逾十年,构建了世界最大规模的知识图谱,计算机视觉、语音、语言等核心技术能力业界领先,百度文心大模型拥有比同行业大模型更高的学习效率及更好的通用性,AIGC借助大模型的跨模态综合技术能力,将会实现大规模应用。