数字经济时代,数据成为提高生产力、发展生产力的关键要素,蕴含着巨大的使用价值与潜能。因此,对当今企业而言,对数据的挖掘与利用均被放到了非常重要的战略位置,与此同时,企业也纷纷采用BI商业智能系统作为实现数据价值的有力工具,用以整合企业内外部海量数据,提高数据分析质量与效率,为具体业务进行赋能,为企业决策提供支撑。而将自然语言处理(NLP)技术引入BI系统,带来的不仅是人机交互方式的变革,更是数据分析质量与效率的跃升。
什么是NLP?
NLP全称Nature Language Processing,即自然语言处理,它是与自然语言的计算机处理有关的技术统称。为了便于理解,其实可以分开来看,“自然语言”是指人与人之间书面或口语交流的形式;“处理”则是指利用计算机对数据进行理解和分析。因此,自然语言处理实际上就是指让计算机理解人类语言,并进行相应的分析;其目标是让计算机/机器在理解语言上像人类一样智能,进而弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。
自然语言处理让机器善解人意
NLP,是人工智能领域中的重要方向之一,被誉为人工智能皇冠上的“明珠”。虽然它听起来似乎很高深,但实际上早已与我们的生活息息相关。比如,我们所熟知的苹果Siri、微软Cortana (中文名:微软小娜)、谷歌Assistant、亚马逊Alexa等智能语音助手,以及公共场所里对答如流的智能服务机器人等,就是自然语言处理的典型应用。正是有了自然处理技术的加持,它们不仅能够理解我们所说的话,还能够针对性地做出反馈。
不过,自然语言处理技术的应用场景却绝非仅限于我们所熟知的语音识别领域,在信息检索、数据整合等领域也同样拥有广泛的应用场景。比如,在信息检索领域,自然语言处理能够大大提高检索的精准度,而且能够促使检索引擎更加精准地理解用户的需求、更加智能化。比如,当你在搜索引擎中搜索 “今天冷吗?”,百度、360等主流的中文搜索引擎不仅会在结果页显示与搜索关键词相关的网页信息,更会在显要位置以图表形式直观地展示当前所处城市的实时及未来的天气情况,而这背后实际上就有自然语言处理技术的身影,这也使得信息检索与获取变得更加方便快捷。在数据整合领域,自然语言处理技术则能提高数据处理的质量、优化输出指令等;也正因如此,自然语言处理技术之于实现数据价值的有力工具——BI而言,也变得越来越重要。
为什么NLP技术对BI而言越来越重要?
在研究咨询机构Gartner发布的2020年和2021年现代分析与商业智能平台应具备的关键功能中,自然语言查询(Natural Language Query,NLQ)和自然语言生成(Natural Language Generation,NLG)连续两年被纳入其中。自然语言查询,即允许用户在搜索框中键入或说出字词来提问,查询数据和分析内容。自然语言生成,即自动创建对数据中发现的见解的丰富语言描述;在分析上下文中,当用户与数据交互时,描述会动态变化,以解释关键发现、图表、仪表盘的含义。这也意味着,在现代分析与商业智能平台中,NLP技术被放在了很重要的位置。
2020年和2021年现代分析与BI平台应具备的关键功能(来源:Gartner)
与此同时,一些市场主流的BI厂商也已经发现了NLP这项技术的好处,并将NLP技术与功能添加到其BI产品中,以改善用户体验。
那么,为什么NLP技术对BI而言越来越重要呢?在笔者看来,一方面在于自然语言处理技术所带来的人机交互方式的变革,进而带来更低的使用门槛;另一方面也在于自然语言处理技术所带来的更加高效的数据分析。
在NLP技术应用于BI系统之前,在人机交互方式是“人适应机器/计算机”,也就是BI用户需要通过编程、建模等方式,用机器懂的语言来进行数据的探索和分析,这就带来了很高的使用门槛,也正是如此,BI常常被调侃为IT专业人员、数据分析师以及数据科学家的数据分析工具。虽然此后为了降低使用门槛,BI也朝着“低代码”的方向发展,但低代码并非无代码,一旦涉及到编程仍需IT专业人员的协助,在交互方式上也依然是“人适应机器”。而在NLP技术应用于BI系统之后,在交互方式上则是“机器/计算机适应人”,大大降低了使用门槛,用户无需学习机器的语言,只需使用自己所熟悉的语言即可进行数据的探索与分析,从而实现“数据民主化”,BI也由此转变为“人人可用的数据分析工具”。
此外,将NLP技术与功能添加到BI产品之中,也相当于增加了一个智能私人数据助手,其实现的界面与我们所熟知的智能语音助手或服务型聊天机器人类似,能提高数据分析的效率与质量,使BI更具洞察力。它能驱动各种应用,结合商业智能分析渗入业务的方方面面,任意时刻都能提供数据驱动的处理,使得基于数据提出问题并得到答案,如求助万能的朋友圈一样简单。
想象一下,你只需在BI系统中,与聊天机器人对话般向BI系统提出问题,如“XX产品近三个月的销售额如何?”XX分公司过去一年的销售目标达成率如何?”,无需多年的数据分析经验,无需熟悉BI系统的操作方式,也无需担心提出的问题机器是否能理解,BI系统即能根据所提出的问题自动创建和生成图表,并添加丰富的自然语义描述,对数据的探索、分析与洞察将变得何其简单!而实际上,正是有了自然语言处理技术与功能的加入,以上所描述的场景正在变成现实。
“观哥”全中文NLP数据分析智能助手,自由探索数据价值
正是看到了自然语言处理技术在BI系统中的应用价值,上海亦策软件在其新一代增强智能协同BI平台——观数台中,已融入了自然语言处理技术与功能,并推出了观数台机器人“观哥”。
观数台机器人——观哥Data Buddy
观数台是亦策软件拥有自主知识产权,专为中国企业量身定制的本土化、轻量级、可嵌入的商业智能(BI)平台,具有数据自动化、增强智能和无处不在的嵌入式分析的特点,为用户提供了相关的洞察分析和可视化,供用户进一步考虑和探索。而观数台机器人——“观哥”则是亦策软件推出的全中文NLP数据分析智能助手,其作为观数台平台的主要组件之一,可提供中文自然语言理解、意图识别的人机交互应用场景,支持上下文关联查询,帮助用户自由探索数据价值。有了“观哥”的协助,数据可智能呈现,想到即看到;同时也不再提前固化用户的数据关系和查询思维,用户可随心所欲随查随看。观数台机器人“观哥”具有以下特点与功能:
全面支持中文自然语言:“观哥”可以接受中文命令提示,实现自由中文对话,并提供中文帮助文档。在查询过程中,“观哥”的中文提示可帮助用户更精确地分析数据。在自由对话的中文场景中,“观哥”提供预测、上下文关联和邮件推送等功能,用户在与“观哥”进行对话时,无需选择应用,直接输入对话,“观哥”即可预测应用;完成对话后,“观哥”也能预测用户还想查看的数据;而且,“观哥”也附带记忆,可以记住用户上下文所说的对话内容,同时“观哥”也能将图文报告通过邮件发送给指定用户。中文帮助文档则可帮助企业零成本培训员工。
观数台“观哥”界面示例
完善的后台管理:在后台管理界面中,管理员可进行一键数据训练和一键NLP发布,应用数据级的安全配置,设置个性化维度及度量,添加常用交互反馈(如“方言化”交互),并可与社交通讯工具集成。
个性化助手:“观哥”可提供预警提醒、可客制化即时报告模板、PDF报告分发以及其它开放API等。
开放性平台:“观哥”不仅支持企业内部应用系统(如BI/CRM/OA等)、企业APP(手机客户端需支持API接口)、社交软件(如微信/钉钉等)等丰富的API接口,而且支持Python/.Net Core源码级别二次开发,从而可进行引擎优化、功能模块开发(如加入语音识别功能模块等) 、私有化SMS/内部消息开发等。
全平台部署模式:“观哥”既支持云端部署,也支持企业私有化部署。在云端部署方面,既支持基于AMS云安全模式;也支持与观数台数据分析集成,提供一站式体验。在企业私有化部署方面,“观哥”可运行在Windows Server、Cent OS、Fedora、Debian、Ubuntu、Linux Mint、OpenSUSE、SUSE Linux Enterprise Server(SLES)、Alpine Linux等多种操作系统环境中。
总的来说,依托于亦策软件专业的开发团队、大数据科学家团队和AI科学家团队,专业的数据分析与知识,深厚的数据分析项目经验,以及庞大的客户群体,观数台机器人“观哥作为全中文NLP数据分析智能助手,具有中文理解准确,响应速度高;行业经验充足,语料库完善;推荐关注精准,自带行业性;数据训练技术成熟;能与主流数据分析产品深入集成等诸多优势。
如今,观数台作为新一代增强智能协同BI平台,已经在制造、零售、医药、教育、金融、航空与物流等众多行业与领域得到广泛应用,而观数台机器人“观哥”作为观数台的主要组件之一,不仅大大改善了人机交互方式,降低了使用门槛,而且也显著提高了数据分析效率与质量,进而赋能各行业客户自由探索数据价值,为其带去更加精准的分析建议与决策。