最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

ChatIE:你想不到的零樣本實(shí)體識(shí)別和關(guān)系抽取方法!

2023-07-30 17:59 作者:汀丶人工智能  | 我要投稿

ChatIE:通過多輪問答問題實(shí)現(xiàn)實(shí)命名實(shí)體識(shí)別和關(guān)系事件的零樣本信息抽取,并在NYT11-HRL等數(shù)據(jù)集上超過了全監(jiān)督模型

零樣本信息抽?。↖nformation Extraction,IE)旨在從無標(biāo)注文本中建立IE系統(tǒng),因?yàn)楹苌偕婕叭藶楦深A(yù),該問題非常具有挑戰(zhàn)性。但零樣本IE不再需要標(biāo)注數(shù)據(jù)時(shí)耗費(fèi)的時(shí)間和人力,因此十分重要。近來的大規(guī)模語言模型(例如GPT-3,Chat GPT)在零樣本設(shè)置下取得了很好的表現(xiàn),這啟發(fā)我們探索基于提示的方法來解決零樣本IE任務(wù)。我們提出一個(gè)問題:不經(jīng)過訓(xùn)練來實(shí)現(xiàn)零樣本信息抽取是否可行?我們將零樣本IE任務(wù)轉(zhuǎn)變?yōu)橐粋€(gè)兩階段框架的多輪問答問題(Chat IE),并在三個(gè)IE任務(wù)中廣泛評(píng)估了該框架:實(shí)體關(guān)系三元組抽取、命名實(shí)體識(shí)別和事件抽取。在兩個(gè)語言的6個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,Chat IE取得了非常好的效果,甚至在幾個(gè)數(shù)據(jù)集上(例如NYT11-HRL)上超過了全監(jiān)督模型的表現(xiàn)。我們的工作能夠?yàn)橛邢拶Y源下IE系統(tǒng)的建立奠定基礎(chǔ)。

1.方法介紹

結(jié)果展示:

  • Description

通過ChatIE 和提示功能的增強(qiáng),它旨在從原始句子中自動(dòng)提取結(jié)構(gòu)化信息,并對(duì)輸入句子進(jìn)行有價(jià)值的深度分析。利用有價(jià)值的結(jié)構(gòu)化信息可以幫助企業(yè)做出深刻的業(yè)務(wù)改進(jìn)決策。demo.

| Task | Name| Lauguages | |---| ---| --- | | RE | entity-relation joint extraction | Chinese, English| |NER |named entity recoginzation | Chinese, English| |EE| event extraction | Chinese, English|

1.1 RE

This task aims to extract triples from plain texts, such as (China, capital, Beijing) , (《如懿傳》, 主演, 周迅).

  • Inputsentence: a plain text.relation type list (rtl)* : {'relation type 1': ['subject1', 'object1'], 'relation type 2': ['subject2', 'object2'], …}

PS: 表示可選,我們?yōu)樗鼈冊(cè)O(shè)置默認(rèn)值。但是為了更好地提取,您應(yīng)該根據(jù)應(yīng)用程序場景指定三個(gè)列表。

  • Examples

    • sentence: Four other Google executives the chief financial officer , George Reyes ; the senior vice president for business operations , Shona Brown ; the chief legal officer , David Drummond ; and the senior vice president for product management , Jonathan Rosenberg earned salaries of $ 250,000 each .

    • rtl: default, see file "default-types"

    • ouptut:


    • sentence: 第五部:《如懿傳》《如懿傳》是一部古裝宮廷情感電視劇,由汪俊執(zhí)導(dǎo),周迅、霍建華、張鈞甯、董潔、辛芷蕾、童瑤、李純、鄔君梅等主演。

    • rtl: default, see file "default-types"

    • ouptut:

1.2 NER

該任務(wù)旨在從純文本中提取實(shí)體, such as (LOC, Beijing) , (人物, 周恩來).

  • Input

    • sentence: a plain text.

    • entity type list (etl)* : ['entity type 1', 'entity type 2', …]

  • Examples

    • sentence: James worked for Google in Beijing, the capital of China.

    • etl: ['LOC', 'MISC', 'ORG', 'PER']

    • ouptut:

    • sentence: 中國黨派創(chuàng)立于中華民國大陸時(shí)期,由陳獨(dú)秀和李大釗領(lǐng)導(dǎo)組織。

    • etl: ['組織機(jī)構(gòu)', '地點(diǎn)', '人物']

    • ouptut:

1.3 EE

該任務(wù)旨在從純文本中提取事件, such as {Life-Divorce: {Person: Bob, Time: today, Place: America}} , {競賽行為-晉級(jí): {時(shí)間: 無, 晉級(jí)方: 西北狼, 晉級(jí)賽事: 中甲榜首之爭}}.

  • Input

    • sentence: a plain text.

    • event type list (etl)* : {'event type 1': ['argument role 1', 'argument role 2', …], …}

    • sentence: Yesterday Bob and his wife got divorced in Guangzhou.

    • etl: default, see file "default-types"

    • ouptut:


    • sentence: 在2022年卡塔爾世界杯決賽中,阿根廷以點(diǎn)球大戰(zhàn)險(xiǎn)勝法國。

    • etl: default, see file "default-types"

    • ouptut:

2.本地使用教學(xué)

react+flask

  1. cd front-end and Run npm install to download required dependencies.

  2. Run npm run start. GPT4IE should open up in a new browser tab.

  3. cd back-end and Run python run.py.

  4. note: node-version v14.17.4 npm-version 9.6.0

  5. you may need to configure proxy on your machine.

3.Prompt提示詞

3.1 EE提示詞

--------------Stage I------------------------------------------- #text denotes the input sentence 事件類型列表: ['財(cái)經(jīng)/交易-出售/收購', '財(cái)經(jīng)/交易-跌停', '財(cái)經(jīng)/交易-加息', '財(cái)經(jīng)/交易-降價(jià)', '財(cái)經(jīng)/交易-降息', '財(cái)經(jīng)/交易-融資', '財(cái)經(jīng)/交易-上市', '財(cái)經(jīng)/交易-漲價(jià)', '財(cái)經(jīng)/交易-漲停', '產(chǎn)品行為-發(fā)布', '產(chǎn)品行為-獲獎(jiǎng)', '產(chǎn)品行為-上映', '產(chǎn)品行為-下架', '產(chǎn)品行為-召回', '交往-道歉', '交往-點(diǎn)贊', '交往-感謝', '交往-會(huì)見', '交往-探班', '競賽行為-奪冠', '競賽行為-晉級(jí)', '競賽行為-禁賽', '競賽行為-勝負(fù)', '競賽行為-退賽', '競賽行為-退役', '人生-產(chǎn)子/女', '人生-出軌', '人生-訂婚', '人生-分手', '人生-懷孕', '人生-婚禮', '人生-結(jié)婚', '人生-離婚', '人生-慶生', '人生-求婚', '人生-失聯(lián)', '人生-死亡', '司法行為-罰款', '司法行為-拘捕', '司法行為-舉報(bào)', '司法行為-開庭', '司法行為-立案', '司法行為-起訴', '司法行為-入獄', '司法行為-約談', '災(zāi)害/意外-爆炸', '災(zāi)害/意外-車禍', '災(zāi)害/意外-地震', '災(zāi)害/意外-洪災(zāi)', '災(zāi)害/意外-起火', '災(zāi)害/意外-坍/垮塌', '災(zāi)害/意外-襲擊', '災(zāi)害/意外-墜機(jī)', '組織關(guān)系-裁員', '組織關(guān)系-辭/離職', '組織關(guān)系-加盟', '組織關(guān)系-解雇', '組織關(guān)系-解散', '組織關(guān)系-解約', '組織關(guān)系-停職', '組織關(guān)系-退出', '組織行為-罷工', '組織行為-閉幕', '組織行為-開幕', '組織行為-游行']。 給定一句話:'{text}'。 請(qǐng)問此句話對(duì)應(yīng)的事件類型有哪些? 要求回答形式: '事件類型: 事件類型內(nèi)容'。 --------------Stage II------------------------------------------- #vent_type and role_list together form the schema for event extraction, where event_type comes from Stage I. #Optional schemas are as follows: {'財(cái)經(jīng)/交易-出售/收購': ['時(shí)間', '出售方', '交易物', '出售價(jià)格', '收購方'], '財(cái)經(jīng)/交易-跌停': ['時(shí)間', '跌停股票'], '財(cái)經(jīng)/交易-加息': ['時(shí)間', '加息幅度', '加息機(jī)構(gòu)'], '財(cái)經(jīng)/交易-降價(jià)': ['時(shí)間', '降價(jià)方', '降價(jià)物', '降價(jià)幅度'], '財(cái)經(jīng)/交易-降息': ['時(shí)間', '降息幅度', '降息機(jī)構(gòu)'], '財(cái)經(jīng)/交易-融資': ['時(shí)間', '跟投方', '領(lǐng)投方', '融資輪次', '融資金額', '融資方'], '財(cái)經(jīng)/交易-上市': ['時(shí)間', '地點(diǎn)', '上市企業(yè)', '融資金額'], '財(cái)經(jīng)/交易-漲價(jià)': ['時(shí)間', '漲價(jià)幅度', '漲價(jià)物', '漲價(jià)方'], '財(cái)經(jīng)/交易-漲停': ['時(shí)間', '漲停股票'], '產(chǎn)品行為-發(fā)布': ['時(shí)間', '發(fā)布產(chǎn)品', '發(fā)布方'], '產(chǎn)品行為-獲獎(jiǎng)': ['時(shí)間', '獲獎(jiǎng)人', '獎(jiǎng)項(xiàng)', '頒獎(jiǎng)機(jī)構(gòu)'], '產(chǎn)品行為-上映': ['時(shí)間', '上映方', '上映影視'], '產(chǎn)品行為-下架': ['時(shí)間', '下架產(chǎn)品', '被下架方', '下架方'], '產(chǎn)品行為-召回': ['時(shí)間', '召回內(nèi)容', '召回方'], '交往-道歉': ['時(shí)間', '道歉對(duì)象', '道歉者'], '交往-點(diǎn)贊': ['時(shí)間', '點(diǎn)贊方', '點(diǎn)贊對(duì)象'], '交往-感謝': ['時(shí)間', '致謝人', '被感謝人'], '交往-會(huì)見': ['時(shí)間', '地點(diǎn)', '會(huì)見主體', '會(huì)見對(duì)象'], '交往-探班': ['時(shí)間', '探班主體', '探班對(duì)象'], '競賽行為-奪冠': ['時(shí)間', '冠軍', '奪冠賽事'], '競賽行為-晉級(jí)': ['時(shí)間', '晉級(jí)方', '晉級(jí)賽事'], '競賽行為-禁賽': ['時(shí)間', '禁賽時(shí)長', '被禁賽人員', '禁賽機(jī)構(gòu)'], '競賽行為-勝負(fù)': ['時(shí)間', '敗者', '勝者', '賽事名稱'], '競賽行為-退賽': ['時(shí)間', '退賽賽事', '退賽方'], '競賽行為-退役': ['時(shí)間', '退役者'], '人生-產(chǎn)子/女': ['時(shí)間', '產(chǎn)子者', '出生者'], '人生-出軌': ['時(shí)間', '出軌方', '出軌對(duì)象'], '人生-訂婚': ['時(shí)間', '訂婚主體'], '人生-分手': ['時(shí)間', '分手雙方'], '人生-懷孕': ['時(shí)間', '懷孕者'], '人生-婚禮': ['時(shí)間', '地點(diǎn)', '參禮人員', '結(jié)婚雙方'], '人生-結(jié)婚': ['時(shí)間', '結(jié)婚雙方'], '人生-離婚': ['時(shí)間', '離婚雙方'], '人生-慶生': ['時(shí)間', '生日方', '生日方年齡', '慶祝方'], '人生-求婚': ['時(shí)間', '求婚者', '求婚對(duì)象'], '人生-失聯(lián)': ['時(shí)間', '地點(diǎn)', '失聯(lián)者'], '人生-死亡': ['時(shí)間', '地點(diǎn)', '死者年齡', '死者'], '司法行為-罰款': ['時(shí)間', '罰款對(duì)象', '執(zhí)法機(jī)構(gòu)', '罰款金額'], '司法行為-拘捕': ['時(shí)間', '拘捕者', '被拘捕者'], '司法行為-舉報(bào)': ['時(shí)間', '舉報(bào)發(fā)起方', '舉報(bào)對(duì)象'], '司法行為-開庭': ['時(shí)間', '開庭法院', '開庭案件'], '司法行為-立案': ['時(shí)間', '立案機(jī)構(gòu)', '立案對(duì)象'], '司法行為-起訴': ['時(shí)間', '被告', '原告'], '司法行為-入獄': ['時(shí)間', '入獄者', '刑期'], '司法行為-約談': ['時(shí)間', '約談對(duì)象', '約談發(fā)起方'], '災(zāi)害/意外-爆炸': ['時(shí)間', '地點(diǎn)', '死亡人數(shù)', '受傷人數(shù)'], '災(zāi)害/意外-車禍': ['時(shí)間', '地點(diǎn)', '死亡人數(shù)', '受傷人數(shù)'], '災(zāi)害/意外-地震': ['時(shí)間', '死亡人數(shù)', '震級(jí)', '震源深度', '震中', '受傷人數(shù)'], '災(zāi)害/意外-洪災(zāi)': ['時(shí)間', '地點(diǎn)', '死亡人數(shù)', '受傷人數(shù)'], '災(zāi)害/意外-起火': ['時(shí)間', '地點(diǎn)', '死亡人數(shù)', '受傷人數(shù)'], '災(zāi)害/意外-坍/垮塌': ['時(shí)間', '坍塌主體', '死亡人數(shù)', '受傷人數(shù)'], '災(zāi)害/意外-襲擊': ['時(shí)間', '地點(diǎn)', '襲擊對(duì)象', '死亡人數(shù)', '襲擊者', '受傷人數(shù)'], '災(zāi)害/意外-墜機(jī)': ['時(shí)間', '地點(diǎn)', '死亡人數(shù)', '受傷人數(shù)'], '組織關(guān)系-裁員': ['時(shí)間', '裁員方', '裁員人數(shù)'], '組織關(guān)系-辭/離職': ['時(shí)間', '離職者', '原所屬組織'], '組織關(guān)系-加盟': ['時(shí)間', '加盟者', '所加盟組織'], '組織關(guān)系-解雇': ['時(shí)間', '解雇方', '被解雇人員'], '組織關(guān)系-解散': ['時(shí)間', '解散方'], '組織關(guān)系-解約': ['時(shí)間', '被解約方', '解約方'], '組織關(guān)系-停職': ['時(shí)間', '所屬組織', '停職人員'], '組織關(guān)系-退出': ['時(shí)間', '退出方', '原所屬組織'], '組織行為-罷工': ['時(shí)間', '所屬組織', '罷工人數(shù)', '罷工人員'], '組織行為-閉幕': ['時(shí)間', '地點(diǎn)', '活動(dòng)名稱'], '組織行為-開幕': ['時(shí)間', '地點(diǎn)', '活動(dòng)名稱'], '組織行為-游行': ['時(shí)間', '地點(diǎn)', '游行組織', '游行人數(shù)']} 事件類型: '{event_type}' 對(duì)應(yīng)的論元角色列表為: {role_list}。 請(qǐng)根據(jù)論元角色列表在上述句子中提取出事件論元, 并以表格形式給出, 表頭分別為 '事件類型', '論元角色', '論元內(nèi)容'。 如果某個(gè)論元角色沒有相應(yīng)的論元內(nèi)容,論元內(nèi)容回答: 無。 #anilla Prompt (Single-turn) #text denotes the input sentence #For event_type_{} and role_list_{}, please refer to ChatIE (Two-stage) above 事件類型: '{event_type_1}' 對(duì)應(yīng)的論元角色列表為: {role_list_1}, 事件類型: '{event_type_2}' 對(duì)應(yīng)的論元角色列表為: {role_list_2}, ... 給定一句話:'{text}'。 請(qǐng)?zhí)崛〕錾鲜鼍渥拥氖录撛? 并以表格形式給出, 表頭分別為 '事件類型', '論元角色', '論元內(nèi)容'。 如果某個(gè)論元角色沒有相應(yīng)的論元內(nèi)容,論元內(nèi)容回答: 無。

3.2 RE

部分展示

假設(shè)你是一個(gè)實(shí)體關(guān)系五元組抽取模型。我會(huì)給你頭實(shí)體類型列表subject_types,尾實(shí)體類型列表object_types,關(guān)系列表relations,再給你一個(gè)句子,請(qǐng)你根據(jù)這三個(gè)列表抽出句子中的subject和object,并組成五元組,且形式為(subject, subject_type, relation, object, object_type)。 給定的句子為:"{}" relations:['所屬專輯', '成立日期', '海拔', '官方語言', '占地面積', '父親', '歌手', '制片人', '導(dǎo)演', '首都', '主演', '董事長', '祖籍', '妻子', '母親', '氣候', '面積', '主角', '自', '校長', '丈夫', '主持人', '主題曲', '修業(yè)年限', '作曲', '號(hào)', '上映時(shí)間', '票房', '飾演', '配音', '獲獎(jiǎng)'] subject_types:['國家', '行政區(qū)', '文學(xué)作品', '人物', '影視作品', '學(xué)校', '圖書作品', '地點(diǎn)', '歷史人物', '景點(diǎn)', '歌曲', '學(xué)科專業(yè)', '企業(yè)', '電視綜藝', '機(jī)構(gòu)', '企業(yè)/品牌', ' 娛樂人物'] object_types:['國家', '人物', 'Text', 'Date', '地點(diǎn)', '氣候', '城市', '歌曲', '企業(yè)', 'Number', '音樂專輯', '學(xué)校', '作品', '語言']

3.3 NER

--------------Vanilla Prompt(單輪)------------------------------------- 假設(shè)你是一個(gè)命名實(shí)體識(shí)別模型,現(xiàn)在我會(huì)給你一個(gè)句子,請(qǐng)根據(jù)我的要求識(shí)別出每個(gè)句子中的實(shí)體,實(shí)體類型只要三種:組織機(jī)構(gòu)、地點(diǎn)、人物。請(qǐng)用列表的形式展示,其中列表的第一個(gè)元素為實(shí)體名稱,第二個(gè)元素為實(shí)體類型。如果該句子中不含有指定的實(shí)體類型,你可以輸出:[]。輸出格式形為:["實(shí)體名稱1", "實(shí)體類型1"], ["實(shí)體名稱2", "實(shí)體類型2"], …。除了這個(gè)列表以外請(qǐng)不要輸出別的多余的話。這個(gè)句子是:"" --------------Stage I------------------------------------------- --------------Stage II------------------------------------------- 假設(shè)你是一個(gè)命名實(shí)體識(shí)別模型,現(xiàn)在我會(huì)給你一個(gè)句子,請(qǐng)根據(jù)我的要求識(shí)別出每個(gè)句子中的實(shí)體,并用列表的形式展示。其中列表的第一個(gè)元素為實(shí)體名稱,第二個(gè)元素為實(shí)體類型。如果該句子中不含有指定的實(shí)體類型,你可以輸出:[]。輸出格式形為:["實(shí)體名稱1", "實(shí)體類型1"], ["實(shí)體名稱2", "實(shí)體類型2"], …。除了這個(gè)列表以外請(qǐng)不要輸出別的多余的話。請(qǐng)識(shí)別出以下句子中類型為“組織機(jī)構(gòu)”的實(shí)體:"" 假設(shè)你是一個(gè)命名實(shí)體識(shí)別模型,現(xiàn)在我會(huì)給你一個(gè)句子,請(qǐng)根據(jù)我的要求識(shí)別出每個(gè)句子中的實(shí)體,并用列表的形式展示。其中列表的第一個(gè)元素為實(shí)體名稱,第二個(gè)元素為實(shí)體類型。如果該句子中不含有指定的實(shí)體類型,你可以輸出:[]。輸出格式形為:["實(shí)體名稱1", "實(shí)體類型1"], ["實(shí)體名稱2", "實(shí)體類型2"], …。除了這個(gè)列表以外請(qǐng)不要輸出別的多余的話。遇到國家的名字時(shí),可以將其識(shí)別成地點(diǎn)類型實(shí)體。請(qǐng)識(shí)別出以下句子中類型為“地點(diǎn)”的實(shí)體:"" 假設(shè)你是一個(gè)命名實(shí)體識(shí)別模型,現(xiàn)在我會(huì)給你一個(gè)句子,請(qǐng)根據(jù)我的要求識(shí)別出每個(gè)句子中的實(shí)體,并用列表的形式展示。其中列表的第一個(gè)元素為實(shí)體名稱,第二個(gè)元素為實(shí)體類型。如果該句子中不含有指定的實(shí)體類型,你可以輸出:[]。輸出格式形為:["實(shí)體名稱1", "實(shí)體類型1"], ["實(shí)體名稱2", "實(shí)體類型2"], …。除了這個(gè)列表以外請(qǐng)不要輸出別的多余的話。請(qǐng)識(shí)別出以下句子中類型為“人物”的實(shí)體:""

4.更多案例展示

4.1 RE

4.2 NER

4.3 EE

4.4 其他

[項(xiàng)目鏈接跳轉(zhuǎn)]https://blog.csdn.net/sinat_39620217/article/details/132007013

更多優(yōu)質(zhì)內(nèi)容請(qǐng)關(guān)注公號(hào):汀丶人工智能;會(huì)提供一些相關(guān)的資源和優(yōu)質(zhì)文章,免費(fèi)獲取閱讀。



ChatIE:你想不到的零樣本實(shí)體識(shí)別和關(guān)系抽取方法!的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
封开县| 绍兴县| 秦皇岛市| 南京市| 黔江区| 五大连池市| 德钦县| 石渠县| 连平县| 南靖县| 牡丹江市| 凤庆县| 丹江口市| 苍南县| 南宫市| 乌拉特后旗| 庄河市| 尖扎县| 河津市| 和平区| 黎平县| 星子县| 迁安市| 香格里拉县| 建阳市| 湟源县| 大余县| 顺义区| 琼结县| 马鞍山市| 裕民县| 高邮市| 贞丰县| 宁国市| 商河县| 宜兰市| 扎囊县| 奉新县| 江都市| 修文县| 封丘县|