美女免费黄网站-美女免费精品高清毛片在线视-美女免费精品视频在线观看-美女免费毛片-成人在激情在线视频-成人在免费观看视频国产

MedGPT:基于權(quán)威RAG評(píng)估框架展現(xiàn)優(yōu)秀醫(yī)療性能

2025年01月22日
未來醫(yī)生 > 新聞中心

檢索增強(qiáng)生成(RAG,Retrieval-Augmented Generation)技術(shù)正革新AI應(yīng)用領(lǐng)域,它整合外部知識(shí)庫與 LLM(Large Language Model,大語言模型)內(nèi)部知識(shí),提高了 AI 系統(tǒng)的準(zhǔn)確性和可靠性。多模態(tài)知識(shí)提取器的知識(shí)“召回能力”直接決定了大模型在回答推理時(shí)能否獲得準(zhǔn)確的專業(yè)知識(shí)。

但隨著 RAG 系統(tǒng)廣泛應(yīng)用,其評(píng)估和優(yōu)化面臨挑戰(zhàn)。現(xiàn)有的評(píng)估方法難以全面體現(xiàn) RAG 系統(tǒng)的復(fù)雜性和實(shí)際表現(xiàn)。近日,亞馬遜、上海人工智能研究院推出 RAGChecker 診斷工具,可為 RAG 系統(tǒng)提供細(xì)粒度、全面且可靠的診斷報(bào)告,并指明提升性能的操作方向。

RAGChecker框架設(shè)計(jì)了包括整體指標(biāo)、診斷檢索器指標(biāo)和診斷生成器指標(biāo)在內(nèi)的一套全面評(píng)估體系。通過對(duì)包含查詢、文檔和真實(shí)答案的樣本進(jìn)行輸入,并借助大型語言模型將文本分解為獨(dú)立的聲明再通過另一個(gè)模型驗(yàn)證每個(gè)聲明的準(zhǔn)確性,實(shí)現(xiàn)對(duì)模型的細(xì)粒度評(píng)估。

在相關(guān)研究中,RAGChecker經(jīng)過嚴(yán)格的實(shí)驗(yàn)驗(yàn)證,其與人類判斷的相關(guān)性遠(yuǎn)超 BLEU、ROUGE、BERTScore 等傳統(tǒng)評(píng)估指標(biāo),這充分彰顯了其科學(xué)性和可靠性。RAGCHECKER的指標(biāo)還可以幫助實(shí)踐者開發(fā)和評(píng)估更有效的RAG系統(tǒng),并通過調(diào)整RAG系統(tǒng)的設(shè)置(如檢索器的數(shù)量、塊大小、塊重疊比例和生成提示)來提供改進(jìn)建議。基于這樣一個(gè)權(quán)威的評(píng)估框架,我們對(duì)MedGPT這一醫(yī)療垂直大模型進(jìn)行了全面的性能測(cè)試。

image.png


Figure:Illustration of the proposed metrics in RAGChecker



本次測(cè)試選取了30個(gè)來自專業(yè)醫(yī)生模擬的醫(yī)療專業(yè)問題,測(cè)試結(jié)果顯示,MedGPT 在多個(gè)關(guān)鍵指標(biāo)上展現(xiàn)出了顯著的優(yōu)勢(shì)。


在整體評(píng)估方面(衡量整個(gè)RAG流程的整體質(zhì)量),MedGPT 的精度(precision)達(dá)到了 65.4,召回(recall)為 58.3,F(xiàn)1 score達(dá)到 59.9,這些指標(biāo)相較于參考原文中提到其他模型的更佳分?jǐn)?shù)在表現(xiàn)出更優(yōu)的得分。這意味著 MedGPT 在處理醫(yī)療問題時(shí),能夠更精準(zhǔn)地命中關(guān)鍵信息,并且全面地覆蓋問題相關(guān)的知識(shí)領(lǐng)域,為醫(yī)療決策提供有力的數(shù)據(jù)支持。

在檢索維度上(查找相關(guān)信息的優(yōu)勢(shì)和劣勢(shì)能力),上下文精度(context precision)達(dá)到 62.2。這表明 MedGPT 在檢索醫(yī)療知識(shí)時(shí),能夠以較高的精準(zhǔn)度篩選出與問題緊密相關(guān)的內(nèi)容,確保為后續(xù)的答案生成提供高質(zhì)量的素材。

而在生成維度(利用檢索到的上下文、處理嘈雜信息以及生成準(zhǔn)確和忠實(shí)響應(yīng)的能力),MedGPT 更是表現(xiàn)出了優(yōu)秀的性能。其上下文利用率(context utilization)為 66.3,充分體現(xiàn)了它能夠高效地整合和運(yùn)用檢索到的醫(yī)療知識(shí)。

模型生成響應(yīng)中不正確聲明在相關(guān) chunk 中的噪音敏感度(noise sensitivity in relevant),MedGPT 僅為 16.4;模型生成響應(yīng)中不正確聲明在不相關(guān) chunk 中的噪音敏感度(noise sensitivity in irrelevant)為 4.5,這一數(shù)據(jù)有力地證明了 MedGPT 在處理復(fù)雜醫(yī)療信息時(shí),具有出色的抗干擾能力,能夠有效過濾掉無關(guān)的噪音信息,專注于生成準(zhǔn)確、有價(jià)值的答案。綜合來看,MedGPT 在醫(yī)療垂直領(lǐng)域的表現(xiàn)已經(jīng)相當(dāng)突出,能夠?yàn)獒t(yī)療專業(yè)人士和患者提供可靠、準(zhǔn)確的醫(yī)療知識(shí)和建議。


image.png

上述測(cè)試結(jié)果有力地證實(shí),MedGPT 作為專注于醫(yī)療領(lǐng)域的垂直大模型,在應(yīng)對(duì)醫(yī)療專業(yè)問題時(shí)呈現(xiàn)出了優(yōu)秀的性能表現(xiàn)。以其高精準(zhǔn)度、高度可靠性以及強(qiáng)大的抗干擾能力,在醫(yī)療人工智能領(lǐng)域中嶄露頭角。無論是輔助醫(yī)療人員進(jìn)行病癥診斷,還是為患者提供專業(yè)的醫(yī)療咨詢服務(wù),MedGPT無疑將會(huì)是非常理想的選擇,能夠?yàn)獒t(yī)療行業(yè)的智能化進(jìn)程提供強(qiáng)勁的推動(dòng)力。

下載未來醫(yī)生
国产一级强片在线观看| 99久久精品国产免费| 欧美大片a一级毛片视频| 香蕉视频一级| 色综合久久天天综合| 国产伦精品一区二区三区无广告 | 国产网站免费视频| 日韩中文字幕在线播放| 韩国毛片免费大片| 一级女性全黄久久生活片| 亚洲精品中文字幕久久久久久| 欧美另类videosbestsex高清| 国产视频网站在线观看| 美女免费精品视频在线观看| 美女免费毛片| 国产成人欧美一区二区三区的| 高清一级毛片一本到免费观看| 国产不卡高清| 香蕉视频一级| 精品在线观看一区| 欧美激情一区二区三区在线| 可以免费看毛片的网站| 国产一区二区精品| 999久久久免费精品国产牛牛| 天天做日日爱夜夜爽| 欧美大片一区| 日韩一级黄色| 四虎影视久久| 日本免费乱人伦在线观看| 99久久精品国产免费| 亚洲天堂免费| 成人免费观看视频| 黄视频网站免费看| 日本免费区| 成人影视在线观看| 欧美大片a一级毛片视频| 成人高清视频在线观看| 精品视频一区二区三区| a级毛片免费全部播放| 久久精品店| 九九久久国产精品| 亚洲第一页色| 久久精品大片| 久久成人综合网| 毛片成人永久免费视频| 日韩在线观看视频免费| 久久久久久久网| 成人高清视频免费观看| 国产91丝袜在线播放0| 免费国产在线观看不卡| 一级女性大黄生活片免费| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 国产91精品一区二区| 天天综合在线观看 | 亚洲第一色在线| 亚洲 激情| 日韩中文字幕在线播放| 国产伦精品一区二区三区无广告| 欧美a级片免费看| 久久国产精品永久免费网站| 国产不卡高清| 日日日夜夜操| 日韩在线观看网站| 国产精品自拍在线观看| 精品视频在线看| 久久99这里只有精品国产| 国产伦精品一区二区三区无广告| 国产不卡精品一区二区三区| 日本特黄一级| 黄视频网站在线观看| 欧美另类videosbestsex高清 | 精品视频在线观看免费| 四虎久久精品国产| 欧美电影免费| 99久久精品国产国产毛片| 99久久精品国产免费| 国产不卡福利| 国产精品自拍在线| 久久国产精品自由自在| 日韩在线观看免费| 成人影视在线观看| 九九九国产| 99色视频| 欧美另类videosbestsex高清 | 欧美日本二区| 可以在线看黄的网站| 一级片片| 青青久久精品| 日韩中文字幕一区| 亚洲 欧美 成人日韩| 国产一区二区精品久| 麻豆网站在线看| 欧美1区| 91麻豆精品国产自产在线| 久久精品大片| 国产成+人+综合+亚洲不卡| 日本伦理网站| 国产麻豆精品免费密入口| 99热精品在线| 高清一级片| 久草免费资源| 成人高清视频在线观看| 美国一区二区三区| 国产伦精品一区二区三区无广告 | 亚洲天堂免费观看| 免费毛片基地| 一本高清在线| 香蕉视频一级| 欧美另类videosbestsex高清| 久久成人性色生活片| 亚洲精品中文一区不卡| 亚欧乱色一区二区三区| 欧美一级视| 亚飞与亚基在线观看| 国产成人啪精品| 国产美女在线观看| 欧美激情在线精品video| 高清一级毛片一本到免费观看| 麻豆污视频| 成人在免费观看视频国产| 91麻豆国产| 91麻豆精品国产自产在线| 四虎久久影院| 欧美另类videosbestsex视频| 成人a大片在线观看| 精品视频在线观看视频免费视频| 可以免费看毛片的网站| 日本免费区| 中文字幕97| 精品国产一区二区三区免费 | 91麻豆精品国产自产在线| 亚洲第一页乱| 午夜欧美成人香蕉剧场| 日韩综合| 成人免费观看男女羞羞视频| 久久福利影视| 国产成a人片在线观看视频| 欧美另类videosbestsex久久 | 国产91丝袜高跟系列| 久久精品免视看国产明星| 欧美α片无限看在线观看免费| 久久99这里只有精品国产| 日韩av片免费播放| 麻豆午夜视频| 免费一级片在线| 999精品视频在线| 国产网站在线| 日韩在线观看网站| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 国产91丝袜在线播放0| 午夜在线亚洲| 一级毛片看真人在线视频| 久久精品人人做人人爽97| 国产91丝袜在线播放0| 国产福利免费视频| 欧美日本二区| 999久久66久6只有精品| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 国产亚洲精品成人a在线| 午夜在线亚洲| 国产精品自拍一区| 久久99这里只有精品国产| 99久久精品国产免费| 精品国产亚洲一区二区三区| 九九热国产视频| 日韩免费在线视频| 高清一级做a爱过程不卡视频| 色综合久久天天综合| 成人免费网站视频ww| 亚欧乱色一区二区三区| 免费国产在线观看| 99久久精品国产高清一区二区| 999久久久免费精品国产牛牛| 国产一区二区精品| 亚欧成人乱码一区二区| 天天色成人网| 四虎影视久久久免费| 日韩在线观看免费| 国产一级生活片| 成人在免费观看视频国产| 青青久久精品| 国产亚洲精品成人a在线| 亚洲 激情| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 亚飞与亚基在线观看| 国产一区二区精品| 国产网站在线| 美女免费精品高清毛片在线视| 黄色福利片| 黄色福利片| 国产欧美精品午夜在线播放| 国产精品免费精品自在线观看| 99热精品一区| 国产麻豆精品| 四虎论坛| 精品毛片视频| 毛片高清| 欧美激情在线精品video| 四虎影视久久|