NLP
智能问答 标签描述

MedicalGPT:基于LLaMA-13B的中英医疗问答模型(LoRA)、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。 训练医疗大模型,实现包括二次预训练、有监督微调、奖励建模、强化学习训练。 分四阶段训练GPT模型,来自AndrejKarpathy的演讲PDFStateofGPT,视频Video 版本迭代 V1:发布中文医疗LoRA模型,基于Ziya-LLaMA-13B-v1模型,SFT微调了一版医疗模型,医疗问答效果有提升,发布微调后的LoRA权重, V0:以医疗为例,训练领域大模型,实现了四阶段训练:包括二次预训练、有监督微调、奖励建...

基于知识图谱的电影知识问答系统:训练TF-IDF向量算法和朴素贝叶斯分类器、在Neo4j中查询 1.项目介绍 训练TF-IDF向量算法和朴素贝叶斯分类器,预测用户文本所属的问题类别 使用分词库解析用户文本词性,提取关键词 结合关键词与问题类别,在Neo4j中查询问题的答案 通过Flask对外提供RESTfulAPI 前端交互与答案展示 2.项目实操教学 2.1数据集简介 { "introduction_by_movie":[ "nm简介", "nm剧情简介", "nm的内容是什么", "nm讲了什么", "nm讲了什么故事", "nm演了什么", "nm的故事梗概是什么", "nm的剧情...

中文人物关系知识图谱(含码源):中文人物关系图谱构建、数据回标、基于远程监督人物关系抽取、知识问答等应用. 项目介绍知识抽取(实体关系抽取)是知识图谱构建中的核心环节,实体关系抽取作为一项基本技术在自然语言处理应用中扮演着重要作用.究其技术而言,主要分成两种三种主流方法: 1,基于规则的方法 在工业界大多还是使用的规则模板的方法这个项目提供了一种基于VOB模式的顺承事件抽取方法,讲的是一种顺承关系基于规则的方法,升级版的话,就是Bootstrapping了,可以通过用户自定义种子模板,不断迭代,最终扩充模式,但置信度这个问题不是很好解决 2,基于学习的方法 这个在学术界用的比较多,从机器学...

领域知识图谱的医生推荐系统:利用BERT+CRF+BiLSTM的医疗实体识别,建立医学知识图谱,建立知识问答系统 本项目主要实现了疾病自诊和医生推荐两个功能并构建了医生服务指标评价体系。疾病自诊主要通过利用BERT+CRF+BiLSTM的医疗实体识别,建立医学知识图谱,从而实现基于患者问诊文本的疾病初诊。这个功能帮助患者初步了解自身的疾病情况并为下一步与医生的交流提供支持。第二个功能是医生推荐。本平台采用基于Jacard距离的Minhash和minhashLSHForest算法来进行推荐,匹配患者的咨询文本和医生的历史问诊信息,从而为患者推荐最适合的医生。最后我们使用django框架进行项目发...

基于中文金融知识的LLaMA系微调模型的智能问答系统:LLaMA大模型训练微调推理等详细教学 基于LLaMA系基模型经过中文金融知识指令精调/指令微调(Instruct-tuning)的微调模型。通过中文金融公开问答数据+爬取的金融问答数据构建指令数据集,并在此基础上对LLaMA系模型进行了指令微调,提高了LLaMA在金融领域的问答效果。 基于已有数据和继续爬取的中文金融数据,将继续利用GPT3.5/4.0API构建高质量的数据集,另在中文知识图谱-金融、CFLEB金融数据集等数据上进一步扩充高质量指令数据集。 基于Chinese-LLaMA和中文金融数据进行指令微调的模型。 基于Meta-...

深入探索智能未来:文本生成与问答模型的创新融合 1.FillingModelwithT5 1.1背景介绍 该项目用于将句子中[MASK]位置通过生成模型还原,以实现UIE信息抽取中MaskThenFilling数据增强策略。 MaskThenFill是一种基于生成模型的信息抽取数据增强策略。对于一段文本,我们其分为「关键信息段」和「非关键信息段」,包含关键词片段称为「关键信息段」。的为关键信息片段,其余的为非关键片段。 大年三十我从北京的大兴机场飞回了成都。 我们随机[MASK]住一部分「非关键片段」,使其变为: 大年三十我从北京[MASK]飞回了成都。 随后,将改句子喂给fillin...

ChatIE:通过多轮问答问题实现实命名实体识别和关系事件的零样本信息抽取,并在NYT11-HRL等数据集上超过了全监督模型 零样本信息抽取(InformationExtraction,IE)旨在从无标注文本中建立IE系统,因为很少涉及人为干预,该问题非常具有挑战性。但零样本IE不再需要标注数据时耗费的时间和人力,因此十分重要。近来的大规模语言模型(例如GPT-3,ChatGPT)在零样本设置下取得了很好的表现,这启发我们探索基于提示的方法来解决零样本IE任务。我们提出一个问题:不经过训练来实现零样本信息抽取是否可行?我们将零样本IE任务转变为一个两阶段框架的多轮问答问题(ChatIE),并在...

从零开始搭建医药领域知识图谱实现智能问答与分析服务(含码源):含Neo4j基于垂直网站数据的医药知识图谱构建、医药知识图谱的自动问答等 项目介绍 关于知识图谱概念性的介绍就不在此赘述。目前知识图谱在各个领域全面开花,如教育、医疗、司法、金融等。本项目立足医药领域,以垂直型医药网站为数据来源,以疾病为核心,构建起一个包含7类规模为4.4万的知识实体,11类规模约30万实体关系的知识图谱。 本项目将包括以下两部分的内容: 基于垂直网站数据的医药知识图谱构建 基于医药知识图谱的自动问答 项目效果展示 以下两图是实际问答运行过程中的截图: 项目运行方式 配置要求:要求配置neo4j数据...