# KGQA_SHZ
#### 简介
基于Neo4j的《水浒传》人物关系可视化及问答系统,该项目可以作为毕业设计,主要用涉及领域包括知识图谱、自然语言处理等知识。运用到的技术架构包括中文自然语言处理技术LTP模型、Python Flask框架、Neo4j图数据库。raw_data是人工合成的数据,spider中的数据是爬取的人物图片数据和人物基本信息数据。
#### 一.项目背景
近年来网络文学蓬勃发展,文学作品的数量和题材层出不穷。一部文学作品的字数通常是超过百万的,这就使得用户仅仅通过自己阅读是很难准确地捕捉到作品中具体的人物关系。如果使用传统的搜索引擎对文学作品中的人物关系进行查询,得到的结果往往都是相对应的大量文字片段的网页链接,无法得到简洁准确的答案。由此,能够弥补上述缺陷的问答系统逐渐受到广泛关注,它不仅允许用户以自然语言的方式进行提问,还能够实现针对用户提问返回相应简洁准确答案句的功能,在一定程度上提高了用户的查询效率。此外,关于中文问答系统的研究还不够成熟,中文语法及语义的复杂性给问答系统研究带来了不小挑战,因此,针对中文的语句相似度研究、文本检索、知识推理等问答系统的应用前景广阔,且有很大发展空间。
#### 二.项目介绍
本项目是对中文问答系统的探索,针对文学作品人物关系复杂,无法进行快速准确查询的问题,本项目提出基于水浒传的人物关系可视化及问答系统,并进行了实例验证,采用分词、句法分析等自然语言处理技术,研究了文学作品水浒传中人物关系,实现了根据用户输入的人物名称快速返回其人物关系的功能,项目功能包括三个主要部分:人物关系检索、人物关系全貌展示和人物关系问答。对于用户提交的问题,首先利用哈工大的语言技术处理平台LTP进行分词,提取关键词;其次,对于已经预处理的数据建立图数据库,然后用分词提取出来的关键字进行Neo4j图数据库的查询,匹配相关信息,利用Python Flask建立前端展示页面,建立知识图谱展示。目前,自然语言处理应用于各个领域,如教育、医疗、司法、金融等等。本项目立足经典著作《水浒传》,爬取水浒传人物数据,构建起一个包含7类实体的水浒传人物关系知识图谱,以及关于水浒传人物关系的问答系统。本项目主要包含以下内容:
- 基于neo4j的水浒传人物关系检索查询。
- 基于neo4j的水浒传人物关系全貌查询。
- 基于neo4j的水浒传人物关系问答系统。
#### 三.项目结构
本项目主要分为以下几个模块:
1. spider模块爬取人物资料,包括人物图片images,人物基本信息(别名、性别、籍贯等)json,生成data.json文件。
2. raw_data文件夹是存放数据处理后的三元组文件。
3. neo_db模块创建知识图谱,建立图数据库以及进行知识图谱的查询。
4. KGQA模块是问答系统模块,主要进行分词、词性标注、命名实体识别。
5. templates模块是HTML页面模块,包括欢迎界面、搜索人物关系页面、人物关系全貌页面人物关系问答页面。
6. static模块存放css和js,是页面样式和效果文件。
7. app.py是整个系统的主入口。
#### 四.总体功能设计
![总体功能设计](https://cdn.jsdelivr.net/gh/zrhcode/Pictures/img/202212132058895.png)
#### 五.项目流程
![项目流程](https://cdn.jsdelivr.net/gh/zrhcode/Pictures/img/202212132009128.png)
#### 六.成果展示
首页
![首页](https://cdn.jsdelivr.net/gh/zrhcode/Pictures/img/202212132010633.png)
人物关系检索
![人物关系检索](https://cdn.jsdelivr.net/gh/zrhcode/Pictures/img/202212132009983.png)
人物关系全貌
![人物关系全貌](https://cdn.jsdelivr.net/gh/zrhcode/Pictures/img/202212132009814.png)
人物关系问答
![人物关系问答](https://cdn.jsdelivr.net/gh/zrhcode/Pictures/img/202212132010181.png)
#### 七.部署步骤
* 0.安装所需的库 执行pip install -r requirement.txt<br>
* 1.先下载好neo4j图数据库,并配好环境。修改neo_db目录下的配置文件config.py,设置图数据库的账号和密码。在cmd中运行neo4j.bat console命令。<br>
* 2.切换到neo_db目录下,执行python create_graph.py 建立知识图谱<br>
* 3.下载好ltp_3.4.0 模型,[LTP下载](https://pan.baidu.com/s/1rRvIThO6ej0pyvFbvFSWpQ?pwd=cpvn),提取码:cpvn。注意放到根目录下,如:D:\ltp_data_v3.4.0。[ltp简介](http://ltp.ai/)<br>
* 4.在KGQA目录下,修改ltp.py里的ltp模型文件的存放目录<br>
* 5.运行python app.py,浏览器打开localhost:5000即可查看<br>
#### 八.说明
文件介绍:<br>
1) app.py是整个系统的主入口<br>
2) templates文件夹是HTML的页面<br>
|-index.html 首页界面<br>
|-search.html 人物关系检索页面<br>
|-all_relation.html 人物关系全貌页面<br>
|-KGQA.html 人物关系问答页面<br>
3) static文件夹存放css和js,是页面的样式和效果的文件<br>
4) raw_data文件夹是存在数据处理后的三元组文件<br>
5) neo_db文件夹是知识图谱构建模块<br>
|-config.py 配置参数<br>
|-create_graph.py 创建知识图谱,图数据库的建立<br>
|-query_graph.py 知识图谱的查询<br>
6) KGQA文件夹是问答系统模块<br>
|-ltp.py 分词、词性标注、命名实体识别<br>
7) spider文件夹是爬虫模块<br>
|- get_*.py 是之前爬取人物资料的代码,已经产生好images和json 可以不用再执行<br>
|-show_profile.py 是调用人物资料和图谱展示在前端的代码。<br>
运行环境介绍:<br>
1) windows10 系统、pycharm professional 2021.3.3、python3.6、neo4j-community-4.4.11、ltp_3.4.0
2) python库的版本:Flask 1.0 、py2neo 2020.1.0、pyltp 0.2.1、bs4 0.0.0
3) 关于neo4j的安装,可以自行百度,本人用的JDK是jdk11
#### 九.不足与改进
本项目的局限性与改进方法如下:
1) relation.txt中存储的是人物关系数据,人物关系数据的大小影响着问答系统最终展示给用户图谱的大小,人物关系数据越多,生成的图谱就越复杂,人物关系越少,生成的实体关系就越少。其次,该数据文件是由人工合成的,数据量较少,该项目的一个可拓展的方向就是如何从网页爬取人物关系数据,并且生成一个三元组文件。
2) 关于问答页面右侧的人物信息展示,是依照relation.txt的数据集中的第一列人名进行网络爬取,爬取对应人名的图片及简介,该做法会导致爬取的人物信息不是水浒传人物信息,导致结果不匹配,这是本项目的第二个局限性,如何筛选出水浒传人物图片与信息是该项目可改进的方向。
3) 问答系统中,输入问句进行分词、句法分析会出现分词结果不准确,切分词错乱,导致无法在数据库中找到创建的图谱,也是本项目的一个局限性,改进方法是对输入的不同类型的句子利用多种切分方式进行分词。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于Neo4j的水浒传人物关系可视化及问答系统python源码+答辩PPT(高分项目),该项目是个人毕设项目,答辩评审分达到98分,代码都经过调试测试,确保可以运行!欢迎下载使用,可用于小白学习、进阶。该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用,亦可作为期末课程设计、课程大作业、毕业设计等。项目整体具有较高的学习借鉴价值!基础能力强的可以在此基础上修改调整,以实现不同的功能。 基于Neo4j的水浒传人物关系可视化及问答系统python源码+答辩PPT(高分项目)基于Neo4j的水浒传人物关系可视化及问答系统python源码+答辩PPT(高分项目)基于Neo4j的水浒传人物关系可视化及问答系统python源码+答辩PPT(高分项目)基于Neo4j的水浒传人物关系可视化及问答系统python源码+答辩PPT(高分项目)基于Neo4j的水浒传人物关系可视化及问答系统python源码+答辩PPT(高分项目)基于Neo4j的水浒传人物关系可视化及问答系统python源码+答辩PPT(高分项目)基于Neo4j的水浒传人物关系可视化及问答系统python源码+
资源推荐
资源详情
资源评论
收起资源包目录
基于Neo4j的水浒传人物关系可视化及问答系统python源码+答辩PPT(高分项目) (197个子文件)
bootstrap.min.css 118KB
nifty.min.css 118KB
wiki.css 109KB
ionicons.min.css 50KB
font-awesome.min.css 28KB
nifty-demo-icons.min.css 9KB
datatables.bootstrap.css 7KB
nifty-demo.min.css 7KB
datatables.responsive.css 2KB
26707bedc25a4344bb99d7e1215825f4.css 895B
pace.min.css 317B
.DS_Store 14KB
.DS_Store 12KB
.DS_Store 6KB
.DS_Store 6KB
.DS_Store 6KB
.DS_Store 6KB
.gitignore 47B
KGQA.html 18KB
search.html 15KB
all_relation.html 14KB
index.html 2KB
KGQA_HLM-master.iml 317B
bg.jpeg 165KB
杨林.jpg 649KB
朱仝.jpg 373KB
朱武.jpg 355KB
宿元景.jpg 319KB
邹润.jpg 302KB
蔡京.jpg 285KB
杨雄.jpg 259KB
吴用.jpg 249KB
韩韬.jpg 246KB
郑天寿.jpg 241KB
林冲.jpg 232KB
侯建.jpg 227KB
周通.jpg 221KB
丘岳.jpg 182KB
殷天锡.jpg 173KB
郑屠.jpg 166KB
孔明.jpg 153KB
魏定国.jpg 151KB
史文恭.jpg 136KB
徐宁.jpg 135KB
阮小七.jpg 120KB
索超.jpg 119KB
邹渊.jpg 116KB
王庆.jpg 115KB
李忠.jpg 114KB
穆弘.jpg 113KB
logo.jpg 113KB
宋万.jpg 111KB
呼延灼.jpg 110KB
欧鹏.jpg 107KB
解宝.jpg 104KB
扈成.jpg 104KB
石勇.jpg 103KB
彭圮.jpg 103KB
张横.jpg 101KB
杜迁.jpg 101KB
韩滔.jpg 101KB
张清.jpg 100KB
马麟.jpg 99KB
阮小五.jpg 98KB
花荣.jpg 98KB
段景住.jpg 97KB
曹正.jpg 96KB
郁保四.jpg 96KB
王进.jpg 95KB
李立.jpg 95KB
王定六.jpg 94KB
燕青.jpg 93KB
武松.jpg 93KB
单廷珪.jpg 93KB
王英.jpg 92KB
bk2.jpg 92KB
裴宣.jpg 91KB
燕顺.jpg 90KB
安道全.jpg 89KB
蒋敬.jpg 88KB
鲍旭.jpg 88KB
陶宗旺.jpg 87KB
焦挺.jpg 86KB
bg.jpg 83KB
樊瑞.jpg 82KB
朱贵.jpg 78KB
ʱǨ.jpg 77KB
鲁智深.jpg 77KB
孟康.jpg 75KB
高俅.jpg 75KB
侯健.jpg 73KB
梁中书.jpg 72KB
顾大嫂.jpg 72KB
李衮.jpg 70KB
项元镇.jpg 70KB
项充.jpg 70KB
王焕.jpg 66KB
祝龙.jpg 66KB
秦明.jpg 65KB
薛永.jpg 63KB
共 197 条
- 1
- 2
资源评论
- kefuxiaoshuang22025-01-06资源不错,内容挺好的,有一定的使用价值,值得借鉴,感谢分享。
yava_free
- 粉丝: 5437
- 资源: 2092
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 2018年对口升学信息一类第一次联考试题(卷).doc
- 见证时代变迁的高考作文题.doc
- 江苏兴化一中2018年高考第四次模拟考试语文试题整理.doc
- 建筑试题3[识图答案].doc
- 静载检测技术基础理论考试(员)C.doc
- 跨境电商人才初级认证试题以与答案.doc
- 临床的护理文书规范模拟考试标准答案09_8_7.doc
- 垃圾分类知识问答.doc
- 六年级英语上[下册]知识点总结.doc
- 六年级写字教学案.doc
- 农业区位因素教学设计.doc
- 牛津译林版2018年_2018年学年8A英语期末专题练习_首字母填空.doc
- 人版小学数学六年级(下册)第3单元圆柱与圆锥教案.doc
- 巧用多媒体有效地复习有丝分裂和减数分裂考点.doc
- 人民教育出版社五年级语文(下册)易错字易错音.doc
- 山东省医学继续教育公共课程急诊及急救答案.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功