OCR PDF ऑनलाइन — मुफ्त, स्कैन किए गए PDF को खोजने योग्य बनाएं, बिना साइन-अप
स्कैन किए गए PDF में खोजने योग्य टेक्स्ट परत जोड़ने के लिए ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) का उपयोग करें। किसी भी छवि-आधारित दस्तावेज़ से टेक्स्ट चुनें और कॉपी करें। मुफ़्त, Tesseract द्वारा संचालित।
› OCR PDF
✅ फ़ाइल डाउनलोड के लिए तैयार है!
PDF पर OCR कैसे चलाएँ —
स्कैन की गई पीडीएफ सिर्फ छवियां हैं - आप किसी भी पाठ को खोज, चयन या कॉपी नहीं कर सकते। PdfDocShift प्रत्येक पृष्ठ का विश्लेषण करने और एक अदृश्य, खोजने योग्य टेक्स्ट परत जोड़ने के लिए सबसे व्यापक रूप से उपयोग किए जाने वाले ओपन-सोर्स OCR इंजन, Tesseract OCR का उपयोग करता है। परिणाम पूरी तरह से खोजने योग्य पीडीएफ है जो मूल के समान दिखता है।
अधिक PDF टूल,
आपको जरूरी सभी PDF ऑपरेशन — एक क्लिक दूर।
तीन चरण,
कोई साइन-अप नहीं। फ़ाइलें ट्रांसमिशन के दौरान एन्क्रिप्ट होती हैं और 2 घंटे बाद स्वतः हटा दी जाती हैं।
OCR क्या है और आपको इसकी आवश्यकता क्यों है?
OCR का अर्थ है ऑप्टिकल कैरेक्टर रिकग्निशन। जब आप किसी भौतिक दस्तावेज़ को स्कैन करते हैं, तो परिणाम एक PDF होता है जो वास्तव में एक तस्वीर है — टेक्स्ट एक छवि है, वास्तविक चयन योग्य वर्ण नहीं। आप इसे खोज नहीं सकते, इससे टेक्स्ट कॉपी नहीं कर सकते, या स्क्रीन रीडर के साथ इसका उपयोग नहीं कर सकते। OCR छवि का पिक्सेल-दर-पिक्सेल विश्लेषण करता है और वर्ण, शब्द और पैराग्राफ की पहचान करता है, फिर दृश्य छवि के पीछे एक टेक्स्ट परत एम्बेड करता है। परिणाम मूल स्कैन के समान दिखता है लेकिन पूरी तरह से खोजने योग्य, कॉपी-पेस्ट करने योग्य और सुलभ है। यह स्कैन किए गए अनुबंधों, संग्रहीत रिकॉर्ड, स्कैन की गई पुस्तकों, ऐतिहासिक दस्तावेज़ों और किसी भी डिजिटाइज़ किए गए कागज़ात के लिए आवश्यक है जिसके साथ आपको प्रोग्रामेटिक रूप से काम करने की आवश्यकता है।
OCR सटीकता को क्या प्रभावित करता है?
तीन कारक OCR सटीकता पर हावी हैं। पहला, scan resolution: 300 DPI उत्कृष्ट परिणाम देता है; 150 DPI आमतौर पर मुश्किल से स्वीकार्य है; इससे नीचे कुछ भी पात्र खो देता है। दूसरा, contrast: काला-सफेद कंट्रास्ट सबसे अच्छा काम करता है; पीले या धुंधले पेज सटीकता को कम करते हैं। तीसरा, font clarity: Times Roman जैसे मानक serif फ़ॉन्ट को लगभग पूरी तरह से पहचाना जाता है; हस्तलिखित या cursive फ़ॉन्ट मनुष्यों के लिए भी अपठनीय हो सकते हैं।
OCR के बाद — खोज और संपादन
OCR पूरा होने के बाद, आउटपुट PDF किसी भी PDF व्यूअर में पूरी तरह से खोजने योग्य है — किसी भी शब्द या वाक्यांश को खोजने के लिए Ctrl+F (या Mac पर Cmd+F) का उपयोग करें। पहचाने गए टेक्स्ट को चुना और कॉपी भी किया जा सकता है। यदि आपको पूरी तरह से संपादन योग्य प्रारूप में टेक्स्ट चाहिए, तो तुरंत बाद PDF to Word टूल का उपयोग करके OCR किए गए PDF को Word में बदलें। ध्यान रखें कि OCR 100% सटीक नहीं है — व्यावसायिक संदर्भ में दस्तावेज़ का उपयोग करने से पहले उचित नाम, तकनीकी शब्द, और असामान्य स्वरूपण को मैनुअल सुधार की आवश्यकता हो सकती है।
OCR PDF
OCR PDF का ऑनलाइन मुफ़्त उपयोग करने के बारे में आपको जो कुछ जानना चाहिए।
OCR (ऑप्टिकल कैरेक्टर रिकॉग्निशन) छवियों से पाठ पढ़ता है और आपके पीडीएफ में खोजने योग्य पाठ परत जोड़ता है। स्कैन की गई पीडीएफ सिर्फ छवियां हैं - ओसीआर के बाद आप टेक्स्ट को खोज, कॉपी और संपादित कर सकते हैं।
PdfDocShift का OCR टूल अंग्रेजी, जर्मन, फ्रेंच और स्पेनिश को सपोर्ट करता है। OCR इंजन (Tesseract) भाषा की परवाह किए बिना स्वचालित रूप से पाठ का पता लगाता है, लेकिन समर्थित भाषाओं के लिए सटीकता सर्वोत्तम है।
OCR समय पृष्ठों की संख्या और स्कैन गुणवत्ता पर निर्भर करता है। एक सामान्य 10 पेज का स्कैन किया हुआ दस्तावेज़ 15-30 सेकंड में पूरा हो जाता है। बहुत बड़े दस्तावेज़ (100+ पृष्ठ) में 2 मिनट तक का समय लग सकता है।
नहीं, OCR मौजूदा पृष्ठ छवियों के नीचे एक अदृश्य पाठ परत जोड़ता है। प्रत्येक पृष्ठ का दृश्य स्वरूप बिल्कुल वैसा ही रहता है - केवल खोज योग्यता और पाठ चयन जोड़ा जाता है।