lsk:LSK理论、系统及应用目标规划简介



1.      LSK理论和系统简介

理论:语言语义知识全息网络模型-简称LSK网络模型,是一种对语言、语义、知识三者统一表达、演算并应用的一整套理论、模型和方法。

系统:以该理论为核心,实现了对信息和知识的表达、描述、解析、理解、生成、查询、转换、推理、自学习的全过程结合在一起的完整体系,初步形成一个模拟大脑思维对于语言能表述的知识和问题进行理解、存储、查询、推理、解决问题的人工智能系统框架。

2.      目标

用这套模型和理论,构建实现统一的信息服务平台,为人类提供自然语言处理和知识处理的多种智能应用,如:机器翻译,机器问答,智能客服、智能助手、语义搜索、情报检索、辅助教学、行业专家系统等。

各种应用处理均统一采用自然语言接口。

3.      具体说明

3.1.     前期研发

已研发三年时间,理论和模型已经完善,并构建起了原型系统,实现了上述方面的理论各方面的验证。

3.2.     要点说明

人类通过自然语言进行信息沟通交流。自然语言有着数百种多种多样不同的外在表现形式(语种、方言等),但内在一定蕴涵并遵循着同样的语义信息结构,因此持不同语言的人们之间才有沟通的基础。但一直以来的难点就是无法给出一个全面、完善、优美的语义模型,这涉及到大脑里边的数百亿神经细胞以及它们之间的连接究竟是如何来表达语言语义信息以及知识的。LSK很大程度上借鉴了这一机制。

另一个方面来看,语义、信息和知识其实是同构的,并无明确的界限,也可以说人们传递的信息和知识就是用一种内在的语义模型描述,然后通过外在的语言形式即声音和文字来传递的。比如,小王说“我们去海南玩了,那里很美”,如果对于这句话分析正确的话将得到【小王去海南玩】【海南很美】等内在语义信息,这些信息本质上和已知的【海南是一个岛屿,是一个旅游胜地】等知识是一样的,唯一的差别是对不同的人来说其重要性不同而已,【知识】更概括而更重要,【信息】更具体而更随意。【海南是一个岛屿】是一条知识,【小王去过海南】何尝不是一条知识呢。虽然对于无关的人来说这后者信息不重要,听听可能就丢弃遗忘了。而对于小王自己和关心小王的人来说,这些是重要信息,也是一种知识,需要存储起来甚至永远铭记,并对今后产生持久影响。

基于这种原则,LSK建立起一个有效的模型和完整的理论,对语言-语义-知识三者进行统一表达。

具体地,LSK对目前自然语言处理领域的多种模型如:语言生成学、关系数据模型、产生式表达模型、面向对象模型、语义网络模型、神经网络模型等多种传统的模型进行了统一。传统的这些模型都是试图从各自看到的一个方面来概括语义和知识表达的整体,最终都因为表达不了丰富而灵活多变的信息和知识,一直不能真正突破。

假如说以前关于自然语言的理论对信息的划分和建模都比较片面,是一种“管中窥豹”的话。LSK采用多层次多维度的信息表达,尽量构建起对人类语言和信息表达这个“豹子”更完整的描述,建立起它的骨骼,肌肉,神经,内脏,皮毛结构的完整模型,形成一个有机整体。这样才能真正接近大脑对语言信息的表达理解以致进行各种方面的处理。

结合概率理论:该模型是将规则和概率结合在一起。不同于目前主流的简单化的只在字符串层面的统计概率分析(丢失了很多重要信息),而是多个层级上描述和处理概率。事实上,大脑就是一个概率机器,只是概率应用的范围不是那么单一,是对多层次,多特征的各种各样信息进行【综合概率】的评判和分析。

对结果的评估是多因素参与得出的,可以排除局部信息噪音和歧义,得到最优化的理解结果。

单个信息和规则都不起绝对的决定作用,没有绝对的规则不能被违背,高层的规则可以压制低层的规则使之可以被违背。比如,【说话】

相关推荐

相关文章