PDF

Как да извлечете маркиран текст от PDF като обикновен текстов файл?

Как да извлечете маркиран текст от PDF като обикновен текстов файл?

Открояването на текст в PDF документ е удобно, за да маркирате важните области, до които можете да осъществите бърз достъп по-късно. Можете да използвате Microsoft Edge, за да подчертаете PDF или друг софтуер, който се предлага с функция за подчертаване на PDF. Понякога може да сте почувствали необходимостта да имате само маркирания текст, за да можете да имате резюмето на PDF, съдържащо целия основен текст. Ако търсите някои начини да запазите само подчертан текст от PDF като TXT файл, тогава тази публикация може да бъде полезна.

Извличане на подчертан текст от PDF

Има безплатен софтуер и услуга за извличане на подчертан текст от PDF файл и запазването му като текстов файл:

Нека проверим тези PDF Highlight Extractor софтуер един по един.

1] PDF Highlight Extractor

PDF Highlight Extractor е една от най-лесните опции за извличане на маркирания текст от PDF файл. Това отворен код PDF екстрактор за подчертаване на текст има две характеристики, които привличат вниманието. Можеш визуализиране на маркиран текст на PDF на софтуерния интерфейс.

Втората функция е, че можете задайте начална или крайна страница или диапазон от страници, за да извлечете текста. Така че, вместо да сканирате целия PDF, можете да дефинирате номера на страници, за да получите маркирания текст.

Друга добра характеристика е, че имате възможност да запазване на текст като обикновен текст или Excel файл.

В неговия интерфейс добавете вашия PDF файл, като използвате дадената опция, и след това натиснете Екстракт бутон. Премахнете отметката Всички страници опция, ако искате да зададете диапазона на страниците или да го оставите както е. След като текстът бъде извлечен, можете да го визуализирате. Накрая натиснете Текст или Excel бутон, за да запазите маркирания текст.

Можете да изтеглите този софтуер от тук. За използването на този софтуер е необходима и Java. И така, инсталирайте Java (ако не е вече) и изпълнете този софтуер, който да използвате.

2] Foxit Reader

Foxit Reader е един от най-добрите безплатни PDF четци. Можете да отворите множество PDF файлове в отделни раздели, да маркирате PDF, да добавите бележка, експортиране на коментари, добавете подписи, и още. Сред огромния списък с функции има и извличане на подчертан текст от PDF. Най-добрата част от тази функция е и тя записва номера на страници заедно с извлечения текст.

За да извлечете маркиран текст от PDF, отворете PDF файл в неговия интерфейс и отворете Коментирайте раздел. В този раздел кликнете върху Износ опция, налична в Управление на коментари раздел. Ще видите Маркиран текст опция. Използвайте тази опция и след това можете да запазите целия маркиран текст като текстов файл.

Ето връзката за изтегляне на този софтуер. По време на инсталацията трябва да изберете персонализирана инсталация да включва само необходимите компоненти на този софтуер.

3] Резюмета.нето

Резюмета.net е безплатна услуга, която ви позволява да анотирате PDF, както и да извличате маркирания текст. Целият маркиран текст се вижда отделно в лявата странична лента. Използвайки тази странична лента, можете също премахнете маркирания текст, който не ви е необходим и след това изтеглете останалата част от маркирания текст.

Преди да изтеглите маркирания текст, можете също да включите номера на страници и изключете на подчертан текст от определен цвят.

Вие също имате възможност да запазете подчертания текст от PDF като Excel или Word файл. Така че, характеристиките са добри. Можете да се регистрирате с безплатен план и след това извлечете 50 акцента или анотации на изтегляне, което е достатъчно в повечето случаи.

Ето връзката към началната му страница. За да извлечете подчертан текст от PDF, добавете PDF от компютър или Google Диск. Когато PDF файлът се качи, анотации и подчертан текст се виждат от лявата страна. Използвай Изтеглете бележки и след това можете да запазите маркирания текст в текст, XLSX, или DOC формат файл.

4] DyAnnotationExtractor

Софтуерът DyAnnotationExtractor може да ви помогне да извлечете подчертан текст и коментари от PDF документ. Това е командна линия софтуер, но използването му е много просто. Само една команда ще извлече текста, подчертан във входния PDF файл.

Можете да получите този софтуер, като използвате тази връзка. Изтеглете неговия ZIP файл и след това го извлечете. За да улесните изпълнението на командата, трябва също да поставите PDF в същата папка, където сте извлекли този софтуер. След това отворете Командния ред прозорец в тази папка. Можете да направите това, като напишете cmd в адресното поле на тази папка и след това натиснете Въведете ключ.

Когато се отвори прозорец CMD, добавете BAT файл на този софтуер, команда за въвеждане, включително пътя на входния PDF, изходна команда и име на изходния файл заедно с '.txt 'разширение. Пълната команда ще бъде-

DyAnnotationExtractor.bat -входен път на входния PDF -изход изходно име на файл.текст

Изпълнете командата. Изчакайте няколко секунди и обикновеният текстов файл ще бъде готов, съдържащ целия маркиран текст и коментари, извлечени от този PDF. Изходният файл се записва в същата папка за въвеждане.

И така, това са някои опции, които можете да използвате, за да извлечете подчертан текст от PDF и след това да запазите изхода като текстов файл. Надявам се тези да помогнат.

Как да променяте настройките на мишката и тъчпада с помощта на Xinput в Linux
Повечето дистрибуции на Linux се доставят с библиотека “libinput” по подразбиране за обработка на входни събития в системата. Той може да обработва вх...
Пренастройте бутоните на мишката си по различен начин за различен софтуер с X-Mouse Button Control
Може би се нуждаете от инструмент, който може да промени контрола на мишката с всяко приложение, което използвате. Ако случаят е такъв, можете да изпр...
Преглед на безжична мишка на Microsoft Sculpt Touch
Наскоро прочетох за Microsoft Sculpt Touch безжична мишка и реших да я купя. След като го използвах известно време, реших да споделя опита си с него. ...