একটি PDF থেকে সব টেক্সট বের করুন
PDF-এর প্রতিটি পাতার সব টেক্সট রিডিং অর্ডারে একটা প্লেইন-টেক্সট ফাইলে নিয়ে আসুন। ফ্রি ও প্রাইভেট, আপনার ব্রাউজারে।
ফাইল ড্রপ করুন, পেস্ট করুন, বা ব্রাউজ করতে ক্লিক করুন
ফাইল আপনার ব্রাউজারেই প্রসেস হয় — সেগুলো কখনো আপনার ডিভাইস থেকে বের হয় না।
চালিয়ে যেতে একটা ফাইল যোগ করুন।
একটি PDF থেকে সব টেক্সট বের করুন
মাঝেমধ্যে আপনার একটা ছোট অংশ না চাই — আপনি চান পুরো PDF-এর সম্পূর্ণ কনটেন্ট টেক্সট হিসেবে, প্রতিটা পাতা, ক্রমানুসারে, পেস্ট করা বা প্রসেস করার জন্য তৈরি। এই এক্সট্র্যাক্টরটা পুরো ডকুমেন্ট ধরে হাঁটে আর এর এমবেড করা সব টেক্সট একটানা একটা প্লেইন-টেক্সট রেজাল্ট হিসেবে ফেরত দেয়, প্রতিটা পাতার স্বাভাবিক রিডিং অর্ডার মেনে। এটা কোনো লম্বা রিপোর্টের লেখা আর্কাইভ করার জন্য, এমন একটা ডকুমেন্টে খোঁজার জন্য যেটা আপনাকে সার্চ করতে দিত না, বা অনুবাদ বা বিশ্লেষণের জন্য পুরো টেক্সট অন্য কোথাও তৈরি করার জন্য আদর্শ। মাল্টি-কলাম লেআউট আর জটিল ডিজাইন মাঝে মাঝে এমনভাবে মিশে যেতে পারে যাতে একটু গুছিয়ে নিতে হয়, কারণ একটা PDF প্যারাগ্রাফ নয়, পজিশন সংরক্ষণ করে, কিন্তু স্ট্যান্ডার্ড সিঙ্গেল-কলাম ডকুমেন্টের জন্য আউটপুট পরিষ্কার আর সম্পূর্ণ। সব টেক্সট এক্সট্র্যাকশনের মতোই এটাও আসল এমবেড করা অক্ষর পড়ে, তাই ডিজিটাল PDF পুরোপুরি কনভার্ট হয় আর স্ক্যান করা পাতাগুলো OCR দিয়ে না গেলে কিছুই ফেরত দেয় না। সবকিছু আপনার ব্রাউজারে লোকালি চলে।
প্রায়ই জিজ্ঞাসিত প্রশ্ন
- এতে কি প্রতিটা পাতার টেক্সট থাকে?
- হ্যাঁ — এটা সব পাতা ধরে হাঁটে আর তাদের টেক্সট রিডিং অর্ডারে একটা সিঙ্গেল রেজাল্ট হিসেবে ফেরত দেয় যা আপনি কপি বা সেভ করতে পারেন।
- কলাম আর লেআউট কি সংরক্ষিত থাকবে?
- না। আপনি শুধু লেখাটা পাবেন, ভিজ্যুয়াল লেআউট নয়। সাধারণ সিঙ্গেল-কলাম পাতা পরিষ্কারভাবে আসে; জটিল মাল্টি-কলাম ডিজাইনে একটু গুছিয়ে নিতে হতে পারে।