6月5日,思必驰与苏州广电传媒集团联合打造的吴方言人工智能主播在苏州广电总台FM91.1新闻综合广播正式上线,这标志着吴方言数字化工作已由数据采集向场景应用转换,同时也开启了AI赋能媒体节目生产之路。
吴方言数字化是苏州贯彻落实国家文化数字化战略,抢抓文化建设新机遇创新高品质文化供给的重要组成部分,由苏州广电传媒集团和思必驰科技股份有限公司具体推进实施。
依托思必驰“语言计算国家新一代人工智能开放创新平台”,苏州广播电视总台将积极推进吴方言数字化工作,重点实施以下四个任务:
一、建立吴方言数字化标准体系,重点突出吴文化区域性差异,并根据吴语发音特点,建设数字化方言字典、词典,推广数字化标准的方言语音库,推动方言数字化的传播。
二、建立吴方言数据库,利用思必驰数据处理技术及数据采集平台,将海量数据处理、数据挖掘、机器学习、人机交互、可视化等技术相结合,按照”数据智能”的方式进一步系统性建设吴语方言数据库。
三、打造方言数字化应用平台,围绕包括人工智能引擎、MLOps、大规模训练模型、数据版本管理工具等核心技术集成,打造纯国产化算力的苏州新一代视听技术智算中心。以移动端(APP、小程序)和桌面端(PC)为承载的软件工具平台,涵盖吴语方言的精准识别、高品质合成、声音复刻、情感合成、方言转换翻译、AR/VR方言互动等功能,打造数字化融媒体创作与应用平台与虚拟数字人创作平台。
四、构筑数据安全堤坝,打造信创下的数据安全及数据存储基础,利用思必驰隐私计算技术,解决数据的使用安全问题。
预计到2025年底,该项目将完成约200人/1000小时苏州方言的声纹采集、标注、合成、识别、转译等工作,通过吴方言语料数据采集、数据处理、机器学习、人机交互、可视化等技术运用,逐步建成吴方言数据库、吴方言数字化标准体系、吴方言数字化应用平台等,并实现吴方言+人工智能在媒体、教育、文旅、大健康、数字家庭等场景应用。
AI+教育
开展吴方言保护和数字化方面的课题研究,依托吴方言数据库的完善,构筑线上线下多媒体端的吴方言学习资源,提供试听新体验。
AI+文旅
争创若干个代表性应用场景项目和应用创新项目,以满足群众游客高品质文旅需求,打造可视、可听、可学、可选的吴语和普通话多语旅游空间。
AI+大健康
通过在大健康领域增加适老化智能设备,使吴方言和普通话无缝转化,利用情感合成技术,满足情感陪护需求,提高养老适老机构服务精准性、针对性。
AI+数字家庭
围绕社区数字文化建设和居民日常生活需求,建设苏州方言数字化传播试点。打通社区服务,增强原住民、吴方言使用者生活的便利,普惠千家万户。