18Docs

PDF से पूरा टेक्स्ट निकालें

PDF के हर पेज का पूरा टेक्स्ट पढ़ने के क्रम में एक ही प्लेन-टेक्स्ट फाइल में निकालें। फ्री और प्राइवेट, आपके ब्राउज़र में।

100% प्राइवेट: यह टूल पूरी तरह आपके ब्राउज़र में चलता है। आपकी फ़ाइल कभी आपकी डिवाइस से बाहर नहीं जाती — न कुछ अपलोड होता है, न कुछ सेव होता है।

फ़ाइलें ड्रॉप करें, पेस्ट करें, या ब्राउज़ करने के लिए क्लिक करें

फ़ाइलें आपके ब्राउज़र में प्रोसेस होती हैं — वे कभी आपकी डिवाइस से बाहर नहीं जातीं।

आगे बढ़ने के लिए एक फ़ाइल जोड़ें।

PDF से पूरा टेक्स्ट निकालें

कई बार आपको सिर्फ एक टुकड़ा नहीं चाहिए होता — आपको PDF का पूरा कंटेंट टेक्स्ट के तौर पर चाहिए होता है, हर पेज का, क्रम में, पेस्ट करने या प्रोसेस करने के लिए तैयार। यह एक्सट्रैक्टर पूरे डॉक्यूमेंट में जाकर उसका सारा एम्बेडेड टेक्स्ट हर पेज के नैचुरल रीडिंग ऑर्डर का पालन करते हुए एक लगातार प्लेन-टेक्स्ट रिजल्ट के तौर पर लौटाता है। यह किसी लंबी रिपोर्ट के शब्दों को आर्काइव करने, किसी ऐसे डॉक्यूमेंट में फाइंड चलाने के लिए जो आपको सर्च नहीं करने देता, या कहीं और ट्रांसलेशन या एनालिसिस के लिए पूरा टेक्स्ट तैयार करने के लिए एकदम सही है। मल्टी-कॉलम लेआउट और जटिल डिज़ाइन कभी-कभी ऐसे तरीके से आपस में मिल सकते हैं जिन्हें थोड़ा ठीक करने की जरूरत पड़े, क्योंकि PDF पोजीशन स्टोर करती है, पैराग्राफ नहीं, लेकिन स्टैंडर्ड सिंगल-कॉलम डॉक्यूमेंट्स के लिए आउटपुट साफ और पूरा होता है। बाकी सभी टेक्स्ट एक्सट्रैक्शन की तरह यह भी असली एम्बेडेड कैरेक्टर्स पढ़ता है, इसलिए डिजिटल PDF पूरी तरह कन्वर्ट होती हैं जबकि स्कैन किए गए पेज तब तक कुछ नहीं लौटाते जब तक उन्हें OCR से न गुजारा जाए। सब कुछ आपके ब्राउज़र में लोकली चलता है।

अक्सर पूछे जाने वाले सवाल

क्या इसमें हर पेज का टेक्स्ट शामिल होता है?
हां — यह सभी पेजों में जाता है और उनका टेक्स्ट रीडिंग ऑर्डर में एक ही रिजल्ट के तौर पर लौटाता है, जिसे आप कॉपी या सेव कर सकते हैं।
क्या कॉलम और लेआउट सुरक्षित रहेंगे?
नहीं। आपको शब्द मिलते हैं, विज़ुअल लेआउट नहीं। सिंपल सिंगल-कॉलम पेज साफ निकलते हैं; जटिल मल्टी-कॉलम डिज़ाइन को थोड़ा ठीक करने की जरूरत पड़ सकती है।

PDF से TEXT इस्तेमाल करने के और तरीके