激情人妻,国产视频不卡中文,麻豆精品一区二区不卡成人网站,精品日韩偷拍

新聞資訊

醫(yī)護(hù)對(duì)講品牌系統(tǒng) python neo4j 醫(yī)療問(wèn)答 huanyong_醫(yī)療知識(shí)圖譜問(wèn)答系統(tǒng)探究(

2023-10-18 12:14

這是 阿拉燈神丁Vicky 的第 23 篇文章

1、項(xiàng)目背景

為通過(guò)項(xiàng)目實(shí)戰(zhàn)增加對(duì)知識(shí)圖譜的認(rèn)識(shí),幾乎找了所有網(wǎng)上的開(kāi)源項(xiàng)目及視頻實(shí)戰(zhàn)教程。

果然,功夫不負(fù)有心人,找到了中科院軟件所劉煥勇老師在上的開(kāi)源項(xiàng)目,基于知識(shí)圖譜的醫(yī)藥領(lǐng)域問(wèn)答項(xiàng)目。

用了兩個(gè)晚上搭建了兩套,Mac版與版,哈哈,運(yùn)行成功?。。?/p>

從無(wú)到有搭建一個(gè)以疾病為中心的一定規(guī)模醫(yī)藥領(lǐng)域知識(shí)圖譜,以該知識(shí)圖譜完成自動(dòng)問(wèn)答與分析服務(wù)。該項(xiàng)目立足醫(yī)藥領(lǐng)域,以垂直型醫(yī)藥網(wǎng)站為數(shù)據(jù)來(lái)源,以疾病為核心,構(gòu)建起一個(gè)包含7類(lèi)規(guī)模為4.4萬(wàn)的知識(shí)實(shí)體,11類(lèi)規(guī)模約30萬(wàn)實(shí)體關(guān)系的知識(shí)圖譜。 本項(xiàng)目將包括以下兩部分的內(nèi)容:1、基于垂直網(wǎng)站數(shù)據(jù)的醫(yī)藥知識(shí)圖譜構(gòu)建

2、基于醫(yī)藥知識(shí)圖譜的自動(dòng)問(wèn)答

2、項(xiàng)目環(huán)境

2.1 系統(tǒng)

搭建中間有很多坑,且行且注意。

配置要求:要求配置neo4j數(shù)據(jù)庫(kù)及相應(yīng)的依賴(lài)包。neo4j數(shù)據(jù)庫(kù)用戶(hù)名密碼記住,并修改相應(yīng)文件。

安裝neo4j,neo4j 依賴(lài)java jdk 1.8版本以上:

根據(jù)neo4j 安裝時(shí)的端口、賬戶(hù)、密碼配置設(shè)置設(shè)置項(xiàng)目配置文件:.py & .py (下載項(xiàng)目時(shí)根據(jù)個(gè)人需要也可使用git)

數(shù)據(jù)導(dǎo)入: .py,導(dǎo)入的數(shù)據(jù)較多,估計(jì)需要幾個(gè)小時(shí)。

.py導(dǎo)入數(shù)據(jù)之前,需要在該文件main函數(shù)中加入:.py

啟動(dòng)問(wèn)答: .py

2.2 Mac系統(tǒng)

mac本身自帶、java jdk環(huán)境,可直接安裝neo4j圖數(shù)據(jù)庫(kù),項(xiàng)目運(yùn)行步驟與基本一樣。

問(wèn)題解答:安裝過(guò)程中如遇問(wèn)題可聯(lián)系: -sbb。

2.3 Neo4j數(shù)據(jù)庫(kù)展示

2.4 問(wèn)答系統(tǒng)運(yùn)行效果

3、項(xiàng)目介紹

該項(xiàng)目的數(shù)據(jù)來(lái)自垂直類(lèi)醫(yī)療網(wǎng)站尋醫(yī)問(wèn)藥,使用爬蟲(chóng)腳本.py,以結(jié)構(gòu)化數(shù)據(jù)為主,構(gòu)建了以疾病為中心的醫(yī)療知識(shí)圖譜,實(shí)體規(guī)模4.4萬(wàn),實(shí)體關(guān)系規(guī)模30萬(wàn)。的設(shè)計(jì)根據(jù)所采集的結(jié)構(gòu)化數(shù)據(jù)生成醫(yī)療問(wèn)答python,對(duì)網(wǎng)頁(yè)的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行xpath解析。

項(xiàng)目的數(shù)據(jù)存儲(chǔ)采用Neo4j圖數(shù)據(jù)庫(kù),問(wèn)答系統(tǒng)采用了規(guī)則匹配方式完成,數(shù)據(jù)操作采用neo4j聲明的。

項(xiàng)目的不足之處在于疾病的引發(fā)原因、預(yù)防等以大段文字返回,這塊可引入事件抽取,可將原因結(jié)構(gòu)化表示出來(lái)。

3.1 項(xiàng)目目錄

.

├── .md

├── \\編譯結(jié)果保存目錄

│ ├── .-36.pyc

│ ├── .-36.pyc

│ └── .-36.pyc

├── .py

├── .pyc

├── .py \\知識(shí)圖譜數(shù)據(jù)入庫(kù)腳本

├── .py \\問(wèn)答程序腳本

├── data

│ └── .json \\本項(xiàng)目的全部數(shù)據(jù),通過(guò).py導(dǎo)neo4j

├── dict

│ ├── check.txt \\診斷檢查項(xiàng)目實(shí)體庫(kù)

│ ├── deny.txt \\否定詞庫(kù)

│ ├── .txt \\醫(yī)療科目實(shí)體庫(kù)

│ ├── .txt \\疾病實(shí)體庫(kù)

│ ├── drug.txt \\藥品實(shí)體庫(kù)

│ ├── food.txt \\食物實(shí)體庫(kù)

│ ├── .txt \\在售藥品庫(kù)

│ └── .txt \\疾病癥狀實(shí)體庫(kù)

├──

│ ├── chat1.png \\系統(tǒng)運(yùn)行問(wèn)答截圖01

│ ├── chat2.png \\系統(tǒng)運(yùn)行問(wèn)答截圖01

│ ├── .png \\知識(shí)圖譜構(gòu)建框架

│ ├── .png \\問(wèn)答系統(tǒng)框架圖

├── img \\.md中的所用圖片

│ ├── chat1.png

│ ├── chat2.png

│ ├── .png

│ ├── .png

│ └── .png

├──

│ ├── .py \\數(shù)據(jù)庫(kù)操作腳本

│ ├── .py \\網(wǎng)絡(luò)資訊采集腳本

│ └── .py \\基于詞典的最大向前/向后腳本

├── .py \\問(wèn)句類(lèi)型分類(lèi)腳本

├── .pyc

├── .py \\問(wèn)句解析腳本

├── .pyc

3.2 知識(shí)圖譜的實(shí)體類(lèi)型

3.3 知識(shí)圖譜的實(shí)體關(guān)系類(lèi)型

3.4 知識(shí)圖譜的屬性類(lèi)型

3.5 問(wèn)答項(xiàng)目實(shí)現(xiàn)原理

本項(xiàng)目的問(wèn)答系統(tǒng)完全基于規(guī)則匹配實(shí)現(xiàn),通過(guò)關(guān)鍵詞匹配,對(duì)問(wèn)句進(jìn)行分類(lèi),醫(yī)療問(wèn)題本身屬于封閉域類(lèi)場(chǎng)景,對(duì)領(lǐng)域問(wèn)題進(jìn)行窮舉并分類(lèi),然后使用的match去匹配查找neo4j,根據(jù)返回?cái)?shù)據(jù)組裝問(wèn)句回答,最后返回結(jié)果。

問(wèn)句中的關(guān)鍵詞匹配:

根據(jù)匹配到的關(guān)鍵詞分類(lèi)問(wèn)句

問(wèn)句解析

查找相關(guān)數(shù)據(jù)

根據(jù)返回的數(shù)據(jù)組裝回答

3.6 問(wèn)答系統(tǒng)支持的問(wèn)答類(lèi)型

4、項(xiàng)目總結(jié)

基于規(guī)則的問(wèn)答系統(tǒng)沒(méi)有復(fù)雜的算法,一般采用模板匹配的方式尋找匹配度最高的答案,回答結(jié)果依賴(lài)于問(wèn)句類(lèi)型、模板語(yǔ)料庫(kù)的覆蓋全面性,面對(duì)已知的問(wèn)題,可以給出合適的答案,對(duì)于模板匹配不到的問(wèn)題或問(wèn)句類(lèi)型,經(jīng)常遇到的有三種回答方式:1、給出一個(gè)無(wú)厘頭的答案;

2、婉轉(zhuǎn)的回答不知道,提示用戶(hù)換種方式去問(wèn);

3、轉(zhuǎn)移話(huà)題,回避問(wèn)題;

例如,本項(xiàng)目中采用了婉轉(zhuǎn)的方式回答不知道:

基于知識(shí)圖譜的問(wèn)答系統(tǒng)的主要特征是知識(shí)圖譜,系統(tǒng)依賴(lài)一個(gè)或多個(gè)領(lǐng)域的實(shí)體,并基于圖譜進(jìn)行推理或演繹,深度回答用戶(hù)的問(wèn)題,基于知識(shí)圖譜的問(wèn)答系統(tǒng)更擅長(zhǎng)回答知識(shí)性問(wèn)題,與基于模板的聊天機(jī)器人有所不同的是它更直接、直觀的給用戶(hù)答案。對(duì)于不能回答、或不知道的問(wèn)題,一般直接返回失敗,而不是轉(zhuǎn)移話(huà)題避免尷尬。

上一篇:醫(yī)院排隊(duì)機(jī)系統(tǒng) 互聯(lián)網(wǎng)醫(yī)療行業(yè)分析
返回
下一篇:醫(yī)院呼叫系統(tǒng) 重慶市加快“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展行動(dòng)計(jì)劃(2018—2020年)