基本信息
所属科技项目名称:中英常识知识图谱与推理引擎研究
项目主管部门:北京市科学技术委员会、中关村科技园区管理委员会
科技成果信息
科技成果名称:中英文常识知识图谱和推理引擎
关键词:知识图谱,认知推理,表示学习,知识服务
科技成果类型:原始创新
科技成果所处阶段:中试放大
科技成果应用领域:信息传输、软件和信息技术服务业
科技成果简介:
大规模常识知识的产生、管理和应用是人工智能研究的核心问题。大数据环境下知识的分布、异构、动态、碎片化和低质等特征给知识工程和知识服务提出了新挑战,既需要从感知角度学习数据的分布表示,又需要从认知角度解释数据的语义,构建新一代开放常识知识图谱和研发认知推理核心技术成为实现下一代人工智能技术突破的关键。
本项目将突破知识图谱构建、表示学习和深度推理等关键技术,构建新一代中英文常识知识图谱及认知推理引擎,并将课题研制的知识获取、表示、推理和服务算法进行开源,为人工智能技术发展提供公共、开放知识服务平台和开源知识推理引擎。历时三年攻关取得了一系列成果:
在关键技术方面。项目组提出基于矩阵分解的知识统一表示学习方法,在十亿级大规模表示计算任务中超越已有模型,成为能够同时实现高效率和有效性的方法,其代码完全开源。提出了基于深度神经网络的统一实体链接框架,解决大规模异构实体图的连接问题,已经被部署到微软学术和AMiner上,以实现两大科技知识图谱的融合。提出了基于认知科学双通道理论的认知推理引擎,由直觉系统和逻辑分析系统组成,通过协调两个模块来构建一张认知图,可通过渐进式的子图扩展进行推理,不局限在单条路径,具有更好的准确性和可解释性,适应更加复杂的推理场景。
在平台系统方面。建立了不同语言知识资源相对平衡的大规模跨语言知识图谱,包含亿级知识数据。研发了具有完全自主知识产权的科技大数据挖掘与知识服务平台,面向互联网海量信息实现全局及定向数据的实时采集更新,年访问量1500万次,覆盖220个国家和地区。构建了超大规模新型预训练模型,将用户行为、常识知识以及认知联系起来,解决当前大规模自监督预训练模型不具有认知能力的问题,实现模块化知识处理布局,支持用户定制化高效知识服务接口。
项目团队突破一系列以精知识、深关联、大规模知识服务为中心的关键技术,系列产品在教育、司法等领域开展了示范性应用,包括为学堂在线开发智能助教机器人,为华宇元典构建百万节点及千万连边的法律知识图谱,助力企业产品升级,推动企业科技创新。
相关人物