【RPA之家UiPath官方教程】PDF自動化
在本課程中,我們將研究PDF文檔的類型以及嘗試從PDF文檔提取數據時可以使用的方法。
受眾:RPA開發(fā)人員
學習目標
在本課程結束時,您將能夠:
安裝UiPath PDF活動包;
使用“讀取PDF”活動,“帶OCR的PDF閱讀”活動和“屏幕抓取”向導從PDF提取大文本段;
從PDF文檔中提取一條信息;
使用選擇器從具有相同布局的多個文件中提取波動值;
使用Anchor Base活動從一系列具有相同結構的PDF文件中提取波動值。
?
關于本課程
介紹
PDF是共享文檔的一種廣泛使用的格式。 在本課程中,我們將研究PDF文檔的類型以及嘗試從PDF文檔提取數據時可以使用的方法。 我們還將介紹處理不穩(wěn)定選擇器時使用的anchor base功能。
?
受眾:RPA開發(fā)人員
課程時長:90分鐘
?
完成課程的要求:通過最低80%的分數通過課程測驗
先決條件:
變量,數據類型和控制流程
數據處理課程
Excel和數據表課程
UI互動課程
選擇器課程
項目組織課程
錯誤和異常處理課程
調試課程
?
學習目標
在本課程結束時,您應該能夠:
1安裝UiPath PDF活動包;
2使用“讀取PDF”活動,“帶OCR的PDF閱讀”活動和“屏幕抓取”向導從PDF提取大文本段;
3從PDF文檔中提取一條信息;
4使用選擇器從具有相同布局的多個文件中提取波動值;
5使用Anchor Base活動從一系列具有相同結構的PDF文件中提取波動值。
?
注意:本課程是使用UiPath Studio 2018.3。創(chuàng)建的。 最新的Community Edition版本中的某些元素可能有所不同。
?
注意
在開始使用本課程之前,如果您正在使用Adobe Acrobat Reader,請注意以下幾點:
注意1:如果使用Adobe Reader DC Acrobat打開PDF,則可能需要采取一些步驟,才能使用UiPath studio方法提取特定元素。啟動Acrobat,然后按Ctrl + K。這將打開“首選項”彈出窗口。從左側面板的類別中選擇“閱讀”。驗證下拉閱讀順序選項是否設置為Acrobat推薦的選項,“從文檔推斷閱讀順序(推薦)”,“頁面與文檔”:應設置為“閱讀整個文檔”和“在標記文檔之前確認” '應取消選中。然后在左側面板上,單擊輔助功能。在“其他輔助功能選項”部分中,如果前兩個框尚未選中,請選中它們:“在未指定顯式制表符順序時使用文檔結構作為制表符順序”,“啟用輔助技術支持”,然后單擊“確定”。
注意2:如果您仍然無法從Acrobat Reader DC打開的PDF文件中提取特定元素,請嘗試使用較舊版本的Acrobat DC(任何以18開頭的版本都可以使用https://www.adobe.com/devnet- docs / acrobatetk / tools / ReleaseNotesDC / index.html#)。 Acrobat DC在計算機上會自動更新到最新的可用版本。在某些最新版本(從19開始)中,可訪問性可能存在問題,Adobe Reader逐漸放棄了對未標記文檔的支持。遵循的步驟:
卸載當前版本的Acrobat Reader DC
安裝Acrobat Reader DC的基本版本https://www.adobe.com/devnet-docs/acrobatetk/tools/ReleaseNotesDC/continuous/dccontinuous.html#dccontinuous
從18開始的任何版本安裝補丁
禁用Adobe Reader自動更新https://www.wintips.org/how-to-disable-automatic-update-in-adobe-reader-dc/