2023年9月21日至23日,中国(南京)文化和科技融合成果展览交易会(以下简称“融交会”)在中国南京召开。融交会作为全国首个聚焦文化科技融合的专题展会,自从2018年起已成功举办5届,构建了全国文化科技融合示范基地成果展示平台、行业深度融合的交流合作平台。

本次大会上,南京文投联合思必驰等多家合作伙伴共同发布了城市文化大数据智能实验室,思必驰AI数字人解决方案及口型驱动技术也亮相会场,收获了现场关注。

9月22日上午,南京文投集团数字化发布会如期进行,南京文投重磅发布了文化大数据、文博大模型、文脉区块链、文都元宇宙等多项全国首发创新成果。

思必驰副总经理邹平博士作为合作伙伴代表发表了致辞,他表示,未来思必驰将充分发挥自身在数字人、语言大模型等领域的技术研发优势,与南京文投在多个维度展开深度合作,共同探索AI大模型在文化大产业的创新落地。

9月22日下午,思必驰产品总监马斌斌出席了大模型时代AIGC赋能文化产业发展论坛圆桌环节。针对生成式AI、大模型、AIGC等行业前沿科技议题,依托于思必驰在AI领域多年的科研探索,马总发表了专业的行业见解。

9月23日上午,思必驰副总裁李春梅在大会分论坛2023第二届中国(南京)文化元宇宙论坛中,发表了《语言文化大模型赋能数字文化产业新应用与新范式》的专题演讲,对于思必驰在语言大模型赋能文化产业生态和吴方言数字化等领域的研发优势和落地成果案例进行了分享。

基于AI口型驱动技术,思必驰为本次大会带来了AI数字人整体解决方案。思必驰AI口型驱动技术通过计算机图形和深度学习技术提取真人说话过程中人物面部变化与语言、声音的关键特征,完成口型模型的建模。该模型可以通过直接输入音频文件或通过语音合成技术将文本合成为音频,推理生成真人说话时的口型并迁移到原本的视频画面中,实现高度逼真的口型还原。

思必驰AI口型驱动技术在现场引起了热烈的讨论,访客只需要随机输入一段文字,就可现场实时生成对应的口型,该段语音也会被同步生成到思必驰展台现场的数字人大屏中,完成人机互动。思必驰数字人可以支持汉语、英语、法语、俄语等多语种和粤语、闽南语、吴语等多种方言以及萝莉音、大叔音等多种趣味音色匹配生成。

数字人的打造需要运用计算机图形学、计算机视觉、自然语言处理、智能语音等领域的知识和技术,而全链路语音语言交互技术恰恰是思必驰多年深耕的创新优势。借着科技创新的时代东风,思必驰于2023年7月正式发布了语言大模型DFM-2。

基于DFM-2大模型推出的自然场景数字人生成技术,在外貌上,思必驰采用扩散生成模型,通过小数据模型训练,基于真人形象,构建出可自由交互的数字形象。在语音上,思必驰通过声音复刻、单人千音、细粒度情感及风格合成、音频场景合成等系列技术,为数字人赋予语言能力,让数字人变得更加鲜活。

思必驰打造的数字人从形态到声音上都媲美真人,不仅能说会道,还精通粤语、四川话、上海话等各地方言及英语、法语、俄语等多国语言,可广泛应用于智能家居、智能车载、智能轨交、市场营销等场景,为人类生活带来更多可能。

在市场营销领域,数字人可用于线上直播创新产品营销推广形式,帮助企业节省人力成本;在智能汽车领域,数字人可融入车载系统,提供导航、新闻播报等服务,在智慧座舱、智慧出行等领域都有很大优势。

在家居领域,数字人可入驻家电大屏中,为用户提供菜谱推荐、家务规划、情感陪伴等交互式体验,成为用户贴心的数字人管家;在轨交领域,数字人可在车站提供路线导航、购票规划、信息咨询等服务,摆脱时间空间局限,灵活高效。

聚焦智能语音创新,思必驰多领域探索科技落地

依托于多年在全链路语音语言交互技术领域的深耕,思必驰已经积累起了一整套的技术专利优势。在DFM-2大模型技术的加持下,思必驰自主研发的全链路智能对话系统定制化平台DUI已升级为2.0版本,可实现场景化对话系统的柔性组合制造,为客户提供定制化服务。

聚焦“云+芯”战略,思必驰坚持软硬件一体化人机对话系统构建,在AI芯片、AI模组和AI终端等领域均有产品落地。思必驰智能会议转写软件麦耳会记和智能会议麦克风音箱M4、M6、M12系列已经在智能会议场景中深度应用。

在赋能文化产业方面,思必驰的AI数字人解决方案已在媒体、文旅、教育、大健康、智能家庭等领域广泛布局,未来,思必驰将继续探索数字人在智能汽车、智能家居、智慧办公、智能政务等领域的落地应用,发挥技术研发优势,落地创新成果,使科技理想照亮现实生活。

免责声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们处理。

相关推荐