近日,在中国信息通信研究院(以下简称“中国信通院”)组织的“大规模预训练模型标准符合性验证”中,紫光股份旗下新华三集团自研的私域大模型百业灵犀(LinSeer)以5级评分通过评测,成为业界首批在模型可信领域获得卓越级(5级)评分的大模型产品。
随着人工智能技术的快速演进,我国AI大模型产业呈现蓬勃发展的态势,通用大模型、行业大模型如雨后春笋般涌现,尽管如此,我国AI技术落地仍面临诸多安全挑战。
为推动大模型产业向更高的可信标准迈进,中国信通院自2022年启动大模型技术研究和评估以来,根据产业发展不断优化迭代,已形成一套覆盖范围全、评测指标精、需求映射准的大模型评测体系。
目前,中国信通院发布的《大规模预训练模型技术和应用评估方法》系列标准共包含模型开发、模型能力、模型运营、模型应用和可信要求五个部分,在此前组织的大模型标准符合性验证中,新华三百业灵犀(LinSeer)已在“模型开发”和“模型能力”两个模块达到优秀级(4+级)。
为引导产业可持续发展,新华三集团与中国信通院联合其他相关单位共同开展编制《大规模预训练模型技术和应用评估方法 第5部分:可信要求》。
此次评估围绕基础软硬件可信、数据可信、模型可信、应用可信四个模块展开了全方位、多维度测评,新华三百业灵犀(LinSeer)在各个模块评测中均表现了出色的技术水准,实力诠释了新华三在大模型领域领先的技术实力。
基础软硬件可信
重点验证大模型基础软硬件的可信性、可靠性及兼容性。百业灵犀(LinSeer)大模型研发及应用基于的软硬件设备具备相关功能可信能力,可支撑模型稳定运行,如建立CPU集群、算力资源调度机制等,同时新华三可以提供CPU和GPU多元化的选择,满足不同市场、不同客户的需求,并通过倡导联接标准化,积极推动服务器内、外部GPU联接标准化和软件生态标准化。
数据可信
重点验证大模型数据采集可靠性、预处理有效性及使用可控性。百业灵犀(LinSeer)一方面能够保障数据在采集阶段的真实性和完整性,同时通过有效的预处理程序优化数据质量,提高后续模型训练的准确性;另一方面,通过对数据的使用设置严格控制,确保数据在整个处理过程中的可信性和合规性。
模型可信
重点验证大模型鲁棒性、稳定性、透明性、公平性及可追溯性。经数据集测试,参测大模型能够满足模型鲁棒性要求,且在研发和应用过程中能够记录模型版本信息和详细流程记录日志,满足模型可追溯性要求。
应用可信
重点验证大模型服务可信和内容可信。百业灵犀(LinSeer)在实际操作环境中表现了超强的可靠性,拥有明确投诉与反馈机制。对所有场景下大模型生成内容进行可信性限制,支持基于用户需要增强,针对所有出入流量和内容进行可信审计和敏感信息拦截,为用户信息和数据可信保驾护航。
新华三集团致力于通过合适的切入场景,合理的模型大小,高效的数据治理、合规的内容安全,以及合用的落地工具加速AIGC应用落地。与通用大模型相比,私域大模型在解决数据可信隐患、缺乏深度行业知识等问题方面更具优势,也更利于帮助政企实现AIGC与实际业务的适配与落地。
新华三百业灵犀(LinSeer)是专为数据安全高度敏感的政企用户设计而生的私域大模型,能够为垂直行业和专属地域客户提供安全、订制、独享、生长的智能化服务,全面支持政企用户利用自身数据训练专属模型。
在功能层面,百业灵犀(LinSeer)拥有信息抽取、意图理解、文本生成、代码生成等核心能力,通过打造高可靠、高性能、高可信的一体化平台,提供从数据管理、模型训练、模型评估到模型部署的全生命周期服务。