文獻閱讀4:ChatGPT與環(huán)境研究(Jun-Jie Zhu)


一、Chatgpt:一種會話 ai,它將從根本上改變我們尋找信息的方式
? ? ? ?ChatGPT是一款最新的基于文本的人工智能(AI)工具,它迅速走紅,有望給我們生活的各個方面帶來變革,包括教育和研究。憑借其先進的自然語言處理(natural language processing -NLP)能力。
? ? ? ?該文獻目的是通過提供10個來自不同環(huán)境研究領(lǐng)域的真實案例,來分享關(guān)于ChatGPT的經(jīng)驗和想法,目標是展示如何利用這一新興工具進行研究,同時強調(diào)潛在的陷阱和挑戰(zhàn)。
? ? ? ?當前最流行的NLP模型之一是生成預(yù)訓練轉(zhuǎn)換器(generative pretrained transformer-GPT)系列。GPT模型是一種深度神經(jīng)網(wǎng)絡(luò),它使用無監(jiān)督學習對大量文本數(shù)據(jù)進行訓練。這些模型可以生成類似人類的反應(yīng),回答問題,甚至寫論文等等。
? ? ? ? GPT系列的最新型號是上周發(fā)布的GPT-4,比上一代版本更加的強大,具有更先進的功能和可塑性。GPT-4是一個大型多模態(tài)模型,接受圖像和文本輸入,然后進行文本輸出。雖然在許多現(xiàn)實場景中不如人類,但卻在各種專業(yè)和學術(shù)基準上顯示出人類水平的表現(xiàn)。

? ? ? ?ChatGPT的流行源于它對任何問題的快速、信息豐富和看似“聰明”的回答。然而,重要的是要質(zhì)疑模型是否真正理解它產(chǎn)生的內(nèi)容,因為即使是簡單的問題也經(jīng)常會出現(xiàn)錯誤和錯誤。因此,必須謹慎行事,避免過度或低估這個新興工具的潛力和能力。

二、發(fā)現(xiàn)哪些是有益的,哪些是有潛力的
1、改進寫作、要點和主題的識別
? ? 1)寫作語言潤色和識別錯誤方面(不應(yīng)依賴 ChatGPT 作為原始內(nèi)容提供商)
? ? 2)可用于從冗長的材料中總結(jié)關(guān)鍵信息。
? ? ? ?Example S1. 歸納長篇文章的要點,以便于更順利和有效地閱讀和理解文獻。?
? ? ?? 對話:[List as bullet points. 100 word-limit per bullet point.] Please summarize 5 key points fromthe following paragraphs: ......(請從以下段落中總結(jié)出5個關(guān)鍵點:[以要點形式列出,每個要點限定100字內(nèi)])

? ? 3)通過內(nèi)容總結(jié)或摘要生成標題
? ? ? ?例如,我們要求基于同一摘要的不同樣式的標題,以便定制用途。ChatGPT 建議的評論文章標題更正式,而演示文稿標題更生動(示例 S2)。
? ? ? ?Example S2. 從給定的文本中生成不同風格的標題
? ? ? ?對話:You are an environmental researcher who did a comprehensive literature review. The keyterminology is "methane emissions"Please provide 5 candidates of title for a review articleand another 5 titles for a presentation based on the following abstract: ......(你是一位環(huán)境研究人員,做了一篇全面的文獻綜述。關(guān)鍵術(shù)語是“甲烷排放”,請根據(jù)以下摘要為一篇綜述文章提供5個候選標題,并為一篇演講提供另外5個標題)

? ? 4)幫助調(diào)整和減少寫作內(nèi)容以滿足字數(shù)限制要求
2、順序信息檢索
? ? ? ?作為一個大型語言模型(large language model-LLM),ChatGPT擅長基礎(chǔ)信息檢索和概念解釋。當一個概念定義明確并在數(shù)據(jù)收集期間出現(xiàn)在多個來源中時,ChatGPT 正確解釋它的可能性更高。這使得它對于需要幫助理解復雜概念(如術(shù)語、方法和策略)的初級研究人員特別有價值。對于在處理多學科問題時,需要從大量信息中快速熟悉新研究領(lǐng)域的高級研究人員也很有幫助。
? ? ? ?為了測試ChatGPT在更全面信息檢索方面的能力,文獻驗證了10個趨勢環(huán)境研究課題,包括PFAS,微塑料,生命周期評估和循環(huán)經(jīng)濟。ChatGPT 成功地在一般層面上正確解釋了所有概念(示例 S3)。
? ? ? ?對話:[Please limit 100 words; listed as bullet points] What is PFAS?([請限制在100字以內(nèi);以要點形式列出] 什么是PFAS?)

? ? ? ?LLM的一個很大功能(與谷歌或百度相比)是它們可以“記住”以前的對話(ChatGPT?3000單詞)。其允許一系列定制問題,以促進有針對性的信息獲取。例如,我們測試了有關(guān)直接鋰提取的順序問題,從一般解釋開始,逐步到用于選擇性鋰吸附的特定材料,并發(fā)現(xiàn)答案內(nèi)容豐富。
3、編碼、調(diào)試和語法說明
? ? ? ?環(huán)境研究越來越依賴于數(shù)據(jù)科學,編程技能變得至關(guān)重要。不幸的是,許多環(huán)境研究人員缺乏必要的編程培訓。幸運的是,ChatGPT 可以通過建議針對特定需求量身定制的代碼片段、識別語法錯誤并提供可能的修復以及解釋復雜或不熟悉的語法來促進學習過程來提供幫助。
? ? ? ?例如,如果希望學習 Python 編碼,ChatGPT 可以幫助定制解決方案,例如數(shù)據(jù)拆分、交叉驗證、超參數(shù)優(yōu)化等。每當您遇到不熟悉的術(shù)語或語法時,ChatGPT 都可以輕松獲得其他解釋。(如何提問?)
? ? ? ?Python中監(jiān)督學習的編碼和學習:我們用一個空氣質(zhì)量預(yù)測的例子來說明如何使用ChatGPT來協(xié)助樣本Python代碼的生成和陌生的語法學習。要求從相對籠統(tǒng)到更具體
對話1:[lmaging you are an environmental data scientist. You are going to conduct a supervised learning research on prediction of daily concentrations of organic carbon aerosols based oncollected environmental variables, including CO, NO, NO2, NOx, 03, PM10, SO2, airpressure, relative humidity, temperature, wind direction, wind speed, and rainfall. Addannotations in the code] Please provide a sample Python code that uses linear regressionand random forest.([假設(shè)你是一位環(huán)境數(shù)據(jù)科學家。你要根據(jù)收集的環(huán)境變量,包括CO、NO、NO2、NOx、03、PM10、SO2、氣壓、相對濕度、溫度、風向、風速和降雨,對有機碳氣溶膠的日濃度預(yù)測進行監(jiān)督學習研究。代碼中的補充說明]請?zhí)峁┮粋€使用線性回歸和隨機森林的Python代碼樣本。)
對話2:Now, you are going to optimize the random forest model by including a validation dataset.Also use cross-validation and gird search. Instead of MSE, using RMSE as the cost function.Optimize five hyperparameters and each of them needs to have 4 different values oroptions.(現(xiàn)在,你要通過包括一個驗證數(shù)據(jù)集來優(yōu)化隨機森林模型。同時使用交叉驗證和網(wǎng)格搜索(自動調(diào)參)代替MSE,使用RMSE作為成本函數(shù)。優(yōu)化五個超參數(shù),每個參數(shù)需要有4個不同的值或選項。)
對話3:[200 word-limit, Use an environmental example. Explain the concept to a beginning learner who doesn't have any machine learning experience] Can you explain what does"min_samples _leaf" do for the model?([200字的限制,使用一個環(huán)境實例。向沒有任何機器學習經(jīng)驗的初級學習者解釋這個概念] 你能解釋一下 "min_samples _leaf "對模型有什么作用嗎?)


三、發(fā)現(xiàn)的問題和需要謹慎的地方
1、捏造信息和缺乏更新的領(lǐng)域知識
? ? ? ?LLM的工作機制確定它可能產(chǎn)生虛假或捏造的信息。也許最重要的問題之一是它提供了特定文本的虛構(gòu)引用或來源,例如捏造的 DOI 或 URL 鏈接。此外,ChatGPT 的訓練數(shù)據(jù)僅擴展到 2021 年,并且由于它在無法訪問互聯(lián)網(wǎng)的情況下生成響應(yīng),因此在數(shù)據(jù)有限的領(lǐng)域(例如學術(shù)文獻)的局限性被放大。因此,ChatGPT經(jīng)常無法提供最先進的科學和工程信息。(OpenAI已宣布在ChatGPT中實現(xiàn)了對插件的初始支持,幫助ChatGPT訪問最新信息、運行計算或使用第三方服務(wù)。與此同時,OpenAI親自上陣提供了兩款插件:網(wǎng)絡(luò)瀏覽器和代碼解釋器。簡單來說ChatGPT終于“聯(lián)網(wǎng)”了,通過第三方插件,在方方面面更好地為用戶提供服務(wù))
? ? ? ?例如我們向ChatGPT提出了一系列關(guān)于PFAS的問題。雖然ChatGPT能夠提供有關(guān)PFAS的有用一般信息,例如它們的物理和化學性質(zhì)(示例S3),但當被問及PFAS的化學結(jié)構(gòu)(示例S6)時,它錯誤地提供了PFOA的化學式。此外,當被問及微生物電化學系統(tǒng)(MES)是否能夠降解PFAS時,ChatGPT斷言MES已被證明可以降解PFAS(示例S7)。

? ? ? ?但是ChatGPT 無法獲得此信息,因為關(guān)于 MES 降解 PFAS 的第一篇出版物是在 ChatGPT 的訓練數(shù)據(jù)截止后發(fā)布的。當被要求提供這些信息的來源時,ChatGPT 捏造了一個看似可信的文獻參考和一個虛構(gòu)的 DOI,導致一篇完全不相關(guān)的文章。相同的模式在多個設(shè)備和帳戶中重復出現(xiàn),ChatGPT提供了不同的文獻參考,但沒有一個是真實的。(缺乏領(lǐng)域知識)。因此,建議研究人員在依賴 ChatGPT 的信息時要謹慎行事,并始終對回復進行事實核查。
2、決策中缺乏問責制
? ? ? ?環(huán)境研究涉及許多決策過程。盡管 ChatGPT 不斷更新和改進,但幾乎不可能完全消除虛假或虛假信息。此外,決策過程仍然嚴重依賴人類的智慧和判斷,人工智能的參與仍然存在爭議。事實上,研究人員發(fā)現(xiàn),ChatGPT會產(chǎn)生帶有社會偏見的反應(yīng),對依靠人工智能解決環(huán)境問題提出了質(zhì)疑。作為額外的復雜性,人工智能不能對他們的決定負責,至少現(xiàn)在還沒有。因此,在邀請人工智能參與決策過程時必須謹慎行事,特別是對于與公共福利密切相關(guān)的環(huán)境問題。
? ? ? ?法學碩士的另一個關(guān)注領(lǐng)域與所使用的培訓材料有關(guān)。由于語料庫的很大一部分來自在線平臺,因此有可能被故意操縱以改變行為(例如,中毒攻擊),盡管對源數(shù)據(jù)集進行了過濾和加權(quán)(例如,GPT-3 中的常見爬網(wǎng)數(shù)據(jù)集),以及 ChatGPT 避免響應(yīng)用戶引發(fā)的陰謀論的預(yù)設(shè)規(guī)則,它可以在多大程度上從用于培訓的語料庫中過濾掉有害信息仍不清楚。

3、依賴 ChatGPT 的機會成本
? ? ? ?雖然 ChatGPT 帶來了很多便利和許多好處,但使用此工具可能會導致過度依賴,并且其單一輸出沒有不同的來源和意見可能會阻礙創(chuàng)造性思維。傳統(tǒng)的搜索引擎提供相關(guān)信息列表,而ChatGPT提供缺乏多樣性的單一響應(yīng)。此外,過分依賴 ChatGPT 可能會阻礙一個人對新知識的學習曲線。例如,如果受訓者依靠該工具生成編程代碼,則該人可能會錯過學習機會,并且無法獲得自己的技能。這個問題反映在許多學校禁止或限制在學習環(huán)境中使用 ChatGPT 的政策中。ChatGPT 應(yīng)該在多大程度上參與各種任務(wù)由自己決定,建議將其用作助手而不是替代品。

四、ChatGPT 的高級用途
1、準確提示以獲得高質(zhì)量的回答
? ? ? ?我們可以而且應(yīng)該通過使用提示工程來設(shè)計更好的問題來提高 ChatGPT 的響應(yīng)質(zhì)量。典型的指南包括角色扮演、文本格式、風格或語氣、字數(shù)限制和其他個性化要求。在這個例子中,我們要求 ChatGPT 用不同的工程提示解釋“厭氧消化”(示例 S9)。我們要求 ChatGPT 扮演不同的角色(例如,演示者、家庭成員、研究員和教授),并提供不同的文本格式或風格(例如,項目符號、簡短對話、研討會演講和帶有降價風格的閱讀材料)。
對話1:What is anaerobic digestion?(什么是厭氧消化?)
對話2:[List as 6 bullet points. Maximum 30 words per point. Used for presentation slides,] What isanaerobic digestion?([以6個要點的形式列出。每點最多30字。用于演示幻燈片] 什么是厭氧消化?)
對話3:[Use a formal and academic tone with sophisticated vocabulary Use environmental acronyms and jargon. Include specific reactions, microorganisms, pathways to explainmechanisms] What is anaerobic digestion in 400 words?([使用正式的學術(shù)語氣和復雜的詞匯,使用環(huán)境術(shù)語和行話。包括具體的反應(yīng)、微生物、路徑來解釋機制] 用400個字說明什么是厭氧消化?)
對話4:[Style or tone guide: Use a conservational, casual style as you are talking with your mom every day. Avoid acronyms and jargon. Use short sentences,] What is anaerobic digestion in200 words?([風格或語氣指南:使用保守的、休閑的風格,因為你每天都在與你的母親交談。避免使用縮略語和專業(yè)術(shù)語。使用短句子]?200個字闡述什么是厭氧消化)
對話5:[lmaging you are an environmental researcher to give a talk in a public seminar. Your audiences are K-9 students. Style or tone guide: Use simple language to break downcomplex concepts. Avoid acronyms and jargon. Use short sentences,] What is anaerobicdigestion?([假設(shè)你是一個環(huán)境研究者,在一個公共研討會上發(fā)表演講。你的學生是K-9學生。風格或語氣指南:使用簡單的語言來分解復雜的概念。避免使用縮略語和專業(yè)術(shù)語。使用短句子] 什么是厭氧消化?)
對話6:[lmaging you are a professor and now prepare a reading material for student. Leave aquestion to student at the end. Format your responses using markdown. Use headings.subheadings, bullet points, bold.] What is anaerobic digestion in 500 words?(假設(shè)你是一位教授,現(xiàn)在為學生準備一份閱讀材料。在最后給學生留一個問題。使用markdown格式化你的回答。使用標題、副標題、要點、粗體。]什么是厭氧消化在500字內(nèi)?)
? ? ? ?通過改變提示,我們能夠獲得一系列針對不同受眾和目的量身定制的輸出,這種方法能夠生成信息豐富且引人入勝的高質(zhì)量回答,使其成為內(nèi)容創(chuàng)建和知識共享等任務(wù)的寶貴工具。
2、幾步即可獲得量身定制的輸出(AI繪畫)
? ? ? ?We consulted and revised from the example and shared text by a Youtuber, Glibatree. The original video link is https://www.youtube.com/watch?v=MAPM6xvvg_0

? ? ? ?例如,我們使用 ChatGPT 和 Midjourney(一種 AI 繪圖工具)來設(shè)計和準備圖 S1 所示的繪圖。我們首先起草了一個描述性文本,介紹了使用中途進行AI繪圖的規(guī)則和格式。然后,我們要求 ChatGPT 為 AI 繪圖生成自定義設(shè)計選項后綴。后續(xù)步驟涉及請求 ChatGPT 使用選項后綴生成繪圖命令。(現(xiàn)在可以識圖了)

? ? ? ?最后,我們在中途應(yīng)用生成的命令來創(chuàng)建和優(yōu)化繪圖。該示例表明,我們可以利用 ChatGPT 以精確且可操作的規(guī)則執(zhí)行文本和代碼之外的更具創(chuàng)造性的工作。
B站教程:【全AI繪圖,ChatGPT+Midjourney的繪圖教程來啦~趕快學起來~】 https://www.bilibili.com/video/BV1Xo4y167dD/?share_source=copy_web&vd_source=99616b2f2e338fe91f4a2b7c22670274

五、展望
? ? ? ?顛覆性技術(shù)既帶來機遇,也帶來爭議。毫無疑問,ChatGPT將改變世界,使研究和其他工作更加自動化或簡化。我們應(yīng)該接受并利用這些變化來推進我們的使命,但我們也應(yīng)該謹慎行事,避免陷阱并認識到局限性。值得注意的是,包括美國化學學會在內(nèi)的許多出版商都明確表示,像ChatGPT這樣的AI工具不符合作者資格。任何使用人工智能工具生成文本或圖像的行為都應(yīng)在稿件中披露。隨著更新的LLM(如GPT-4)的引入,它們將變得更加可靠,能夠處理更復雜的任務(wù),這可以緩解當前的一些問題。但是,我們使用 ChatGPT 和其他 AI 工具的方法應(yīng)該保持一致。人類是主要的內(nèi)容創(chuàng)造者,人工智能工具是我們的助手,旨在改善我們的生活質(zhì)量和我們生活的環(huán)境。
? ? ? ?“AI不會替代人類,那會用AI的人類會替代你嗎?”
