如何使用文檔文字提取功能?
1 功能介紹
文檔文字提取是集簡(jiǎn)云的一款內(nèi)置應(yīng)用,用于提取某種文檔類型中的文字,提取文字大小支持在10M以內(nèi),支持多種文檔類型進(jìn)行提取,包括PDF、DOCX、TXT、PPTX、HTML、XLSX等,便于用戶更好地使用。
2 場(chǎng)景示例
企業(yè)為招募更多合適的人才,通常會(huì)通過(guò)BOSS直聘、51Job、智聯(lián)等多渠道進(jìn)行招聘。在接收到應(yīng)聘者發(fā)送的簡(jiǎn)歷后,人力資源部門需要對(duì)簡(jiǎn)歷進(jìn)行匯總和分析,提供招聘建議,并將這些信息錄入到表單系統(tǒng),例如明道云中,以便相關(guān)招聘部門能夠查看和使用。
現(xiàn)在通過(guò)集簡(jiǎn)云搭建一個(gè)自動(dòng)化流程,使用集簡(jiǎn)云郵件觸發(fā)獲取郵件中的文件,引入ChatGPT進(jìn)行總結(jié)和評(píng)估,再同步到明道云,具體的流程圖如下:

但在此流程中,文件轉(zhuǎn)文字的步驟仍然需要人工手動(dòng)來(lái)操作完成,面對(duì)大量簡(jiǎn)歷,人工手動(dòng)同步信息無(wú)疑費(fèi)時(shí)費(fèi)力且易出錯(cuò),一旦其中的某項(xiàng)信息提取時(shí)出現(xiàn)不一致,還需重新核對(duì),增加大量的工作量,同時(shí)也會(huì)引起不必要的麻煩。
基于此情況,集簡(jiǎn)云研發(fā)了文檔文字提取功能,可以實(shí)現(xiàn)在短時(shí)間內(nèi)完成大量文件的文字提取,提高工作效率,降低錯(cuò)誤率,節(jié)省時(shí)間和精力。具體流程如下:

點(diǎn)擊此模板,立即使用
3 操作步驟
步驟1:郵件觸發(fā)-當(dāng)接收到郵件時(shí)
步驟2:文檔文字提取-提取文檔中的文字
步驟3:ChatGPT:對(duì)話ChatGPT (原生ChatGPT 3.5 Turbo模型)
步驟4:明道云應(yīng)用-添加數(shù)據(jù)到指定工作表
其中步驟2-文檔文字提取的操作如下:
(1)選擇執(zhí)行應(yīng)用-執(zhí)行動(dòng)作:文檔文字提取-提取文檔中的文字
(2)字段匹配
●?文檔類型:可選擇PDF、DOCX、TXT、PPTX、HTML、XLSX等,示例:PDF
●?文件網(wǎng)站地址:插入變量(文件網(wǎng)址通常包含文件名和路徑信息,以文件類型的擴(kuò)展名結(jié)尾。示例:https://test.com/1.pdf. )

(3) 點(diǎn)擊發(fā)送數(shù)據(jù)

(4)即可獲取到一條樣本數(shù)據(jù)

更多場(chǎng)景示例
●?郵件系統(tǒng)+文檔文字提取+OA系統(tǒng):每當(dāng)企業(yè)人員收到的郵件包含附件文檔時(shí),可以通過(guò)文檔文字提取應(yīng)用自動(dòng)提取文檔中所需要的文字信息,并通過(guò)企業(yè)微信/釘釘?shù)萇A系統(tǒng)發(fā)送消息通知。
●?表單系統(tǒng)+文檔文字提取+表單系統(tǒng):企業(yè)表單系統(tǒng)存儲(chǔ)大量簡(jiǎn)歷,常包含PDF、DOCX等多種格式,可以通過(guò)文檔文字提取應(yīng)用自動(dòng)提取候選人文字信息,并將信息再返回至表單系統(tǒng)匯總,便于人事查看。