最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

Doctran 和 LLM:分析消費者投訴的強大組合

2023-10-31 11:07 作者:Momodel平臺  | 我要投稿

介紹

在當(dāng)今競爭激烈的市場中,企業(yè)努力有效地了解和解決消費者投訴。消費者投訴可以揭示廣泛的問題,從產(chǎn)品缺陷和糟糕的客戶服務(wù)到計費錯誤和安全問題。它們在企業(yè)與其客戶之間的反饋(關(guān)于產(chǎn)品、服務(wù)或體驗)循環(huán)中起著至關(guān)重要的作用。分析和理解這些投訴可以為產(chǎn)品或服務(wù)改進(jìn)、客戶滿意度和整體業(yè)務(wù)增長提供有價值的見解。在本文中,我們將探討如何利用 Doctran Python 庫來分析消費者投訴、提取見解并做出數(shù)據(jù)驅(qū)動的決策。

Doctran

Doctran 是一個最先進(jìn)的 Python 庫,專為文檔轉(zhuǎn)換和分析而設(shè)計。它提供了一組函數(shù)來預(yù)處理文本數(shù)據(jù)、提取關(guān)鍵信息、分類/分類、查詢、匯總信息以及將文本翻譯成其他語言。Doctran 利用 LLM(大型語言模型),例如基于 OpenAI GPT 的模型和開源 NLP 庫來剖析文本數(shù)據(jù)。

它支持以下六種類型的文檔轉(zhuǎn)換:

  1. 提?。簭奈臋n中提取有用的功能/屬性。

  2. 編輯:在將數(shù)據(jù)發(fā)送到 OpenAI 之前,從文檔中刪除個人身份信息 (PII),例如姓名、電子郵件 ID、電話號碼等。在內(nèi)部,它利用 spaCy 庫來刪除敏感信息。

  3. 審問:將文檔轉(zhuǎn)換為問答格式。

  4. 完善:從文檔中刪除與一組預(yù)定義主題無關(guān)的任何內(nèi)容。

  5. 總結(jié):將文檔表示為簡明、全面和有意義的摘要。

  6. 翻譯:將文檔翻譯成其他語言。

該集成也可在 LangChain 框架 document_transformers 模塊內(nèi)使用。LangChain 是一個尖端的框架,用于構(gòu)建 LLM 驅(qū)動的應(yīng)用程序。

LangChain 提供了探索和利用各種開源和閉源 LLM 模型的靈活性。它允許無縫連接到各種外部數(shù)據(jù)源,例如 PDF、文本文件、Excel 電子表格、PPT 等。它還能夠嘗試不同的提示、參與提示工程、利用內(nèi)置鏈和代理等。

在 Langchain 的 document_transformers 模塊中,有三種實現(xiàn):DoctranPropertyExtractor、DoctranQATransformer 和 DoctranTextTranslator。它們分別用于提取、詢問和翻譯文檔轉(zhuǎn)換。

安裝

Doctran 可以使用 pip 命令輕松安裝。

了解了 doctran 庫之后,現(xiàn)在讓我們使用下面用三重反引號 (“`) 括起來的消費者投訴來探索 doctran 中可用的不同類型的文檔轉(zhuǎn)換。

“`

十一月26 2021

經(jīng)理

客戶服務(wù)部

金牛座商店

新德里 – 110023

主題:關(guān)于“VIP”洗衣機有缺陷的投訴

尊敬的先生,

我于 2022 年 7 月 15 日購買了一臺自動洗衣機,型號為 G24,發(fā)票編號為 1598。

上周,這臺機器突然停止工作,盡管我們付出了一切努力,但從那時起就沒有工作過。漂洗過程完成后機器停止運行,導(dǎo)致很多問題。此外,從過去一天左右開始,機器也開始發(fā)出很大的噪音,給我們帶來了不便。

請派您的技術(shù)人員進(jìn)行維修,如果需要,請在下周內(nèi)更換。

希望早日得到回應(yīng)

你真的

“`

將投訴加載為 Doctran 文檔

要使用 doctran 執(zhí)行文檔轉(zhuǎn)換,首先我們需要將原始文本轉(zhuǎn)換為 doctran 文檔。 doctran 文檔是一種針對向量搜索進(jìn)行優(yōu)化的基本數(shù)據(jù)類型。它表示一段非結(jié)構(gòu)化數(shù)據(jù)。它由原始內(nèi)容和關(guān)聯(lián)的元數(shù)據(jù)組成。

通過在 open_ai_key 參數(shù)中指定 OPENAI_API_KEY 來實例化 doctran 對象。接下來,通過調(diào)用 doctran 對象頂部的 parse() 方法,將原始內(nèi)容解析為 doctran 文檔。

輸出:

DocTransformers 公司

1. 提取

doctran 的主要功能之一是從文檔中提取關(guān)鍵屬性。在內(nèi)部,它利用 OpenAI 函數(shù)調(diào)用從文檔中提取屬性(數(shù)據(jù)點)。它使用 OpenAI GPT-4 模型,代幣限制為 8000 個代幣。

GPT-4 是 Generative Pre-trained Transformer 4 的縮寫,是 OpenAI 開發(fā)的多模態(tài)大型語言模型。與其前輩相比,GPT-4 表現(xiàn)出處理復(fù)雜任務(wù)的增強能力。此外,它可以在文本旁邊使用視覺輸入(如圖像、圖表、模因等)。該模型在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上都達(dá)到了人類水平的表現(xiàn),包括統(tǒng)一律師考試。

我們需要通過實例化要提取的每個屬性的 ExtractProperty 類來定義一個架構(gòu)。架構(gòu)包含幾個關(guān)鍵元素:屬性名稱、說明、數(shù)據(jù)類型、可選值列表和必需標(biāo)志(布爾指示器)。

在這里,我們指定了四個屬性——類別、情緒、攻擊性和語言。

要檢索屬性,我們可以在文檔上調(diào)用 extract() 函數(shù)。此函數(shù)將屬性作為參數(shù)。

提取操作將返回一個新文檔,該文檔 extracted_properties 鍵中提供了屬性。

輸出:

2. 審訊

Doctran 允許我們將文檔中的內(nèi)容轉(zhuǎn)換為問答格式。用戶查詢通常表述為問題。因此,為了在使用矢量數(shù)據(jù)庫時改進(jìn)搜索結(jié)果,將信息轉(zhuǎn)換為問題可能會有所幫助。與索引原始文本相比,從這些問題創(chuàng)建索引可以更好地檢索上下文。

要查詢文檔,請使用內(nèi)置的 interrogate() 函數(shù)。它返回一個新文檔,生成的 Q&A 集 extracted_properties 屬性中可用。

輸出:

3. 總結(jié)

使用 doctran,我們還可以生成對原文的簡潔而有意義的摘要。調(diào)用 summarize() 函數(shù)來匯總文檔。此外,指定 token_limit 以配置摘要的大小。

輸出:

4. 翻譯

將文檔翻譯成其他語言可能很有幫助,尤其是當(dāng)用戶需要用不同的語言查詢知識庫時,或者當(dāng)給定語言沒有最先進(jìn)的嵌入模型時。

我們的消費者投訴用例的語言翻譯對于擁有多語言客戶群的全球企業(yè)非常有用。使用內(nèi)置的 translate() 函數(shù),我們可以將信息翻譯成其他語言,例如印地語、西班牙語、意大利語、德語等。

輸出:

結(jié)論

在數(shù)據(jù)驅(qū)動的決策時代,消費者投訴分析是一個至關(guān)重要的過程,可以改進(jìn)產(chǎn)品和服務(wù),并最終提高客戶滿意度。使用 LLM 和高級 NLP 工具,我們可以將原始文本數(shù)據(jù)轉(zhuǎn)換為可操作的見解,從而推動業(yè)務(wù)增長和改進(jìn)。在本文中,我們討論了 doctran,這是該庫在消費者投訴的幫助下支持的不同類型的文檔轉(zhuǎn)換。

關(guān)鍵要點

● 消費者投訴不僅是不滿,也是寶貴的反饋來源,可以為企業(yè)提供重要的見解。

● doctran Python 庫以及 GPT-4 等大型語言模型 (LLM) 為轉(zhuǎn)換和分析文檔提供了強大的工具集。它支持各種轉(zhuǎn)換,例如提取、編輯、詢問、匯總和翻譯。

● Doctran 使用 OpenAI 的 GPT-4 模型的提取功能可以幫助企業(yè)從文檔中提取關(guān)鍵屬性。

● 使用 doctran 的詢問功能將文檔內(nèi)容轉(zhuǎn)換為問答格式可改善上下文檢索。這種方法對于構(gòu)建有效的搜索索引和促進(jìn)更好的搜索結(jié)果很有價值。

● 擁有全球客戶群的企業(yè)可以從 doctran 的語言翻譯功能中受益,使信息以多種語言訪問。此外,它還提供了生成簡明而有意義的文本內(nèi)容摘要的能力。

常見問題

Q1:Doctran Python 庫的主要目的是什么?

答:doctran Python 庫的主要目的是執(zhí)行文檔轉(zhuǎn)換和分析。它提供了一組功能來預(yù)處理文本數(shù)據(jù)、提取有價值的信息、對內(nèi)容進(jìn)行分類和分類,以及將文本翻譯成不同的語言。它使用大型語言模型 (LLM),如 OpenAI 基于 GPT 的模型來剖析文本數(shù)據(jù)。

Q2:如何使用 Doctran 從文檔中提取關(guān)鍵屬性,它可以提取哪些屬性示例?

答:Doctran 可以使用 OpenAI 的 GPT-4 模型從文檔中提取關(guān)鍵屬性。這些屬性在架構(gòu)中定義,可以使用 extract() 函數(shù)進(jìn)行檢索。一些例子是從原始文本中提取類別、情緒、攻擊性、語言。

Q3:將文檔內(nèi)容轉(zhuǎn)換為問答格式有什么好處,如何使用 Doctran 實現(xiàn)這一點?

答:使用 Doctran 的詢問功能將文檔內(nèi)容轉(zhuǎn)換為問答格式可以改善信息檢索。與索引原始文本相比,它允許更好的上下文檢索,使其更適合搜索引擎。內(nèi)置的 interrogate() 函數(shù)將文檔轉(zhuǎn)換為問答格式,從而增強搜索結(jié)果。

Q4:為什么語言翻譯在消費者投訴分析中很重要,Doctran 如何支持此功能?

答:語言翻譯在消費者投訴分析中至關(guān)重要,特別是對于擁有多語言客戶群的企業(yè)。此功能可確保全球受眾可以訪問信息。Doctran 支持使用內(nèi)置的 translate() 函數(shù)進(jìn)行語言翻譯,使文檔能夠翻譯成各種語言,例如印地語、西班牙語、意大利語、德語等。

原文地址:https://www.analyticsvidhya.com/blog/2023/10/doctran-and-llms-a-powerful-duo-for-analyzing-consumer-complaints/

非常感謝大家的閱讀,小Mo在這里祝你在末來的 Python 學(xué)習(xí)職業(yè)生涯中一切順利!

后續(xù)小Mo會不定期更新書籍、視頻等學(xué)習(xí)資源,以上這些書籍資料也可通過關(guān)注微信公眾號免費獲取哦!

歡迎關(guān)注我們的微信公眾號:MomodelAl

同時,歡迎使用「Mo AI編程」微信小程序

以及登錄官網(wǎng),了解更多信息:Mo 人工智能教育實訓(xùn)平臺

Mo,發(fā)現(xiàn)意外,創(chuàng)造可能

注:部分資源來源于互聯(lián)網(wǎng),若有侵權(quán),請直接聯(lián)系作者刪除。


Doctran 和 LLM:分析消費者投訴的強大組合的評論 (共 條)

分享到微博請遵守國家法律
临潭县| 依兰县| 石门县| 阿城市| 尼勒克县| 瓮安县| 色达县| 梓潼县| 常宁市| 沙雅县| 万山特区| 铜鼓县| 高要市| 健康| 宜兰市| 福建省| 岱山县| 英吉沙县| 金秀| 阜平县| 孝义市| 连山| 平安县| 沙田区| 双鸭山市| 静乐县| 望奎县| 寿宁县| 抚顺市| 安宁市| 天台县| 定边县| 龙井市| 横山县| 句容市| 郎溪县| 河津市| 东光县| 新干县| 吐鲁番市| 萨迦县|