PDF से पूरा टेक्स्ट निकालें
PDF के हर पेज का पूरा टेक्स्ट पढ़ने के क्रम में एक ही प्लेन-टेक्स्ट फाइल में निकालें। फ्री और प्राइवेट, आपके ब्राउज़र में।
फ़ाइलें ड्रॉप करें, पेस्ट करें, या ब्राउज़ करने के लिए क्लिक करें
फ़ाइलें आपके ब्राउज़र में प्रोसेस होती हैं — वे कभी आपकी डिवाइस से बाहर नहीं जातीं।
आगे बढ़ने के लिए एक फ़ाइल जोड़ें।
PDF से पूरा टेक्स्ट निकालें
कई बार आपको सिर्फ एक टुकड़ा नहीं चाहिए होता — आपको PDF का पूरा कंटेंट टेक्स्ट के तौर पर चाहिए होता है, हर पेज का, क्रम में, पेस्ट करने या प्रोसेस करने के लिए तैयार। यह एक्सट्रैक्टर पूरे डॉक्यूमेंट में जाकर उसका सारा एम्बेडेड टेक्स्ट हर पेज के नैचुरल रीडिंग ऑर्डर का पालन करते हुए एक लगातार प्लेन-टेक्स्ट रिजल्ट के तौर पर लौटाता है। यह किसी लंबी रिपोर्ट के शब्दों को आर्काइव करने, किसी ऐसे डॉक्यूमेंट में फाइंड चलाने के लिए जो आपको सर्च नहीं करने देता, या कहीं और ट्रांसलेशन या एनालिसिस के लिए पूरा टेक्स्ट तैयार करने के लिए एकदम सही है। मल्टी-कॉलम लेआउट और जटिल डिज़ाइन कभी-कभी ऐसे तरीके से आपस में मिल सकते हैं जिन्हें थोड़ा ठीक करने की जरूरत पड़े, क्योंकि PDF पोजीशन स्टोर करती है, पैराग्राफ नहीं, लेकिन स्टैंडर्ड सिंगल-कॉलम डॉक्यूमेंट्स के लिए आउटपुट साफ और पूरा होता है। बाकी सभी टेक्स्ट एक्सट्रैक्शन की तरह यह भी असली एम्बेडेड कैरेक्टर्स पढ़ता है, इसलिए डिजिटल PDF पूरी तरह कन्वर्ट होती हैं जबकि स्कैन किए गए पेज तब तक कुछ नहीं लौटाते जब तक उन्हें OCR से न गुजारा जाए। सब कुछ आपके ब्राउज़र में लोकली चलता है।
अक्सर पूछे जाने वाले सवाल
- क्या इसमें हर पेज का टेक्स्ट शामिल होता है?
- हां — यह सभी पेजों में जाता है और उनका टेक्स्ट रीडिंग ऑर्डर में एक ही रिजल्ट के तौर पर लौटाता है, जिसे आप कॉपी या सेव कर सकते हैं।
- क्या कॉलम और लेआउट सुरक्षित रहेंगे?
- नहीं। आपको शब्द मिलते हैं, विज़ुअल लेआउट नहीं। सिंपल सिंगल-कॉलम पेज साफ निकलते हैं; जटिल मल्टी-कॉलम डिज़ाइन को थोड़ा ठीक करने की जरूरत पड़ सकती है।