ब्लॉग

स्कैन की गई PDF को Word में कैसे बदलें (और एक स्कैन अलग क्यों होता है)

TL;DRयह रही ईमानदार जवाब: आप /convert/pdf-to-word पर एक स्कैन की गई PDF को संपादन योग्य Word फ़ाइल में नहीं बदल सकते, क्योंकि एक स्कैन किसी पेज की तस्वीर होती है जिसके अंदर कोई चुनने योग्य टेक्स्ट नहीं होता। हमारा मुफ़्त, ब्राउज़र में चलने वाला PDF to Word टूल उस असली टेक्स्ट को फिर से बनाता है जो PDF में मौजूद होता है और उसे .docx में बदल देता है — लेकिन एक स्कैन में पढ़ने के लिए कोई असली टेक्स्ट नहीं होता, सिर्फ़ पिक्सेल होते हैं। उन पिक्सेल को वापस शब्दों में बदलने के लिए OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) की ज़रूरत होती है, जो यह टूल अभी नहीं करता। अच्छी खबर: Word, Google Docs, या ज़्यादातर ऐप्स से एक्सपोर्ट की गई PDF असली टेक्स्ट से भरी होती हैं और अच्छी तरह बदल जाती हैं। यह गाइड आपको बताती है कि आपके पास किस तरह की फ़ाइल है यह कैसे पहचानें, और दोनों ही स्थिति में क्या उम्मीद करें। सब कुछ आपके डिवाइस पर चलता है — आपकी फ़ाइल कभी अपलोड नहीं होती।

टूल आज़माएं

छोटा जवाब: एक स्कैन की गई PDF OCR के बिना संपादन योग्य Word नहीं बन सकती

एक सामान्य PDF टेक्स्ट को असली अक्षरों के रूप में सहेजती है — अक्षर, शब्द, फ़ॉन्ट, और उनकी स्थिति फ़ाइल के अंदर सेव होते हैं। /convert/pdf-to-word पर हमारा कन्वर्टर उन अक्षरों को पढ़ता है और उन्हें एक संपादन योग्य Word दस्तावेज़ में फिर से बना देता है। अगर आप अपने PDF रीडर में किसी वाक्य को हाइलाइट करके कॉपी कर सकते हैं, तो वह टेक्स्ट असली है, और वह बदल जाएगा।

एक स्कैन की गई PDF अलग होती है। जब आप किसी कागज़ के पेज को स्कैन करते हैं या किसी दस्तावेज़ की फ़ोटो खींचते हैं, तो नतीजा एक छवि होता है — पिक्सेल का एक ग्रिड जो आपकी आँखों को टेक्स्ट जैसा दिखता है लेकिन उसमें एक भी असली अक्षर नहीं होता। पढ़ने के लिए कुछ नहीं होता और फिर से बनाने के लिए भी कुछ नहीं होता, इसलिए कन्वर्ज़न खाली वापस आता है।

एक स्कैन से संपादन योग्य टेक्स्ट पाने के लिए, आपको पहले OCR की ज़रूरत होती है, जो छवि का विश्लेषण करता है और हर अक्षर का अनुमान लगाता है। यह एक अलग चरण है जिसे हम अभी सपोर्ट नहीं करते, इसलिए फ़िलहाल एक स्कैन की गई PDF को यहाँ संपादन योग्य Word में नहीं बदला जा सकता। हम आपको एक खाली दस्तावेज़ थमाने के बजाय यह बात पहले ही बता देना बेहतर समझते हैं।

5 सेकंड में कैसे पता करें कि आपकी PDF स्कैन है या नहीं

बदलने से पहले, यह एक त्वरित परीक्षण करें। PDF को किसी भी रीडर (या अपने ब्राउज़र) में खोलें और अपने माउस से टेक्स्ट की एक लाइन चुनने की कोशिश करें, जैसे आप उसे कॉपी करने वाले हों।

  • अगर टेक्स्ट शब्द दर शब्द हाइलाइट होता है और आप उसे कॉपी कर सकते हैं — तो यह असली-टेक्स्ट वाली PDF है। यह Word में बदल जाएगी।
  • अगर आपका कर्सर बस पूरे पेज पर एक नीला बॉक्स बना देता है और कुछ भी टेक्स्ट के रूप में हाइलाइट नहीं होता — तो यह एक स्कैन (एक छवि) है, और इसे OCR की ज़रूरत है।
  • एक और संकेत: ज़ूम इन करके पास से देखें। असली टेक्स्ट किसी भी ज़ूम पर साफ़ रहता है; एक स्कैन फ़ोटो की तरह धुंधला या पिक्सेलेटेड हो जाता है।
  • त्वरित मूल जाँच: जो PDF Word, Google Docs, Pages, या 'Print to PDF' कमांड से बनी हैं वे लगभग हमेशा असली टेक्स्ट होती हैं। स्कैनर, कॉपियर, या फ़ोन स्कैनिंग ऐप से बनी PDF लगभग हमेशा छवियाँ होती हैं।

हमारा कन्वर्टर खाली नतीजों के बारे में ईमानदार क्यों है

अगर आप एक स्कैन की गई PDF /convert/pdf-to-word को देते हैं, तो टूल चुनने योग्य टेक्स्ट ढूँढता है, कोई नहीं पाता, और आपको एक खाली .docx देने के बजाय एक स्पष्ट संदेश के साथ रुक जाता है। यह संदेश आपको बताता है कि फ़ाइल एक स्कैन जैसी दिखती है और OCR अभी सपोर्ट नहीं है।

हम यह जानबूझकर करते हैं। बहुत सारे टूल खुशी-खुशी एक स्कैन को 'कन्वर्ट' कर देंगे और आपको एक खाली पेज या एक Word फ़ाइल वापस देंगे जिसमें एक ही पूरे-पेज की छवि होती है जिसे आप अब भी संपादित नहीं कर सकते। यह आपका समय बर्बाद करता है। हम बजाय इसके यह कहना बेहतर समझते हैं कि 'यह काम नहीं करेगा, और यह रहा कारण' ताकि आप सही अगला कदम ढूँढ सकें।

क्या अच्छी तरह बदलता है — और क्या नहीं

जब आपकी PDF में असली टेक्स्ट होता है, तो टूल हर लाइन को पढ़ता है, फ़ॉन्ट का आकार बनाए रखता है, और एम्बेडेड फ़ॉन्ट से बोल्ड और इटैलिक का पता लगाता है, फिर पैराग्राफ़ को एक साफ़, संपादन योग्य .docx में फिर से बना देता है जिसे आप Word, Google Docs, या Pages में खोल सकते हैं।

  • अच्छी तरह बदलता है: पत्र, रिज़्यूमे, रिपोर्ट, अनुबंध, निबंध, और किसी वर्ड प्रोसेसर से एक्सपोर्ट किए गए अन्य टेक्स्ट-आधारित दस्तावेज़।
  • ठीक-ठाक बदलता है: हेडिंग और पैराग्राफ़ वाले सरल एकल-कॉलम लेआउट।
  • शायद परफ़ेक्ट न हो: जटिल बहु-कॉलम लेआउट, भारी टेबल, और सटीक स्पेसिंग — शब्द तो आ जाते हैं, लेकिन लेआउट मूल के बिल्कुल अनुरूप नहीं हो सकता।
  • सपोर्ट नहीं है: स्कैन की गई/सिर्फ़-छवि वाली PDF (OCR की ज़रूरत), और छवियों व जटिल टेबल का भरोसेमंद पुनर्निर्माण।

लेआउट के बारे में ईमानदार उम्मीदें रखना

असली-टेक्स्ट वाली PDF के साथ भी, यह एक टेक्स्ट-निष्ठ कन्वर्ज़न है, पिक्सेल-परफ़ेक्ट प्रतिलिपि नहीं। लक्ष्य आपको समझदार पैराग्राफ़ संरचना और फ़ॉन्ट आकारों के साथ संपादन योग्य शब्द वापस देना है — न कि हर कॉलम, टेबल बॉर्डर, और ग्राफ़िक को बिल्कुल हू-ब-हू दोबारा बनाना।

एक सादे पत्र या रिपोर्ट के लिए, नतीजा आमतौर पर मूल के बहुत करीब दिखता है। तीन कॉलम, साइडबार, और एक डेटा टेबल वाले मैगज़ीन-शैली के पेज के लिए, उम्मीद करें कि टेक्स्ट सही ढंग से आएगा लेकिन लेआउट को Word में कुछ सफ़ाई की ज़रूरत होगी। आगे भेजने से पहले हमेशा .docx खोलकर उसे सरसरी तौर पर देख लें।

अगर आपके पास अभी एक स्कैन की गई PDF है तो क्या करें

जब तक यहाँ OCR उपलब्ध नहीं होता, एक स्कैन के लिए आपके पास कुछ ईमानदार विकल्प हैं:

  • एक मूल फ़ाइल ढूँढें। अगर दस्तावेज़ किसी डिजिटल स्रोत से आया है, तो मूल Word, Google Docs, या टेक्स्ट-आधारित PDF माँगें — वह बिना किसी OCR के साफ़-सुथरे ढंग से बदल जाती है।
  • स्कैन करने के बजाय फिर से एक्सपोर्ट करें। अगर स्रोत ऐप आपके नियंत्रण में है, तो किसी प्रिंटआउट को स्कैन करने के बजाय 'Export as PDF' या 'Print to PDF' का उपयोग करें; इससे टेक्स्ट असली बना रहता है।
  • छोटे दस्तावेज़ फिर से टाइप करें। एक-पेज के फ़ॉर्म या पत्र के लिए, उसे टाइप कर लेना अक्सर OCR की गलतियाँ सुधारने से वैसे भी तेज़ होता है।
  • फ़िलहाल किसी समर्पित OCR टूल का उपयोग करें, फिर परिणामी असली-टेक्स्ट वाली PDF को Word में बदलने के लिए यहाँ वापस लाएँ।

निजी और मुफ़्त, कुछ भी अपलोड नहीं होता

आपकी PDF बदले या न बदले, यह कभी आपके कंप्यूटर से बाहर नहीं जाती। कन्वर्ज़न पूरी तरह आपके ब्राउज़र में लोकल कोड का उपयोग करके चलता है, इसलिए फ़ाइल आपके अपने डिवाइस पर ही पढ़ी, प्रोसेस, और सेव होती है — कभी किसी सर्वर पर अपलोड नहीं होती। यह अनुबंधों, स्टेटमेंट, और किसी भी ऐसी चीज़ के लिए मायने रखता है जिसे आप किसी और की मशीन पर नहीं रखना चाहेंगे।

कोई साइनअप नहीं, आउटपुट पर कोई वॉटरमार्क नहीं, और कोई दैनिक सीमा नहीं। /convert/pdf-to-word खोलें, एक टेक्स्ट-आधारित PDF डालें, और एक संपादन योग्य .docx डाउनलोड करें।

स्कैन की गई PDF को Word में कैसे बदलें (और एक स्कैन अलग क्यों होता है)

एडिटर खोलें

FAQ

क्या मैं यहाँ एक स्कैन की गई PDF को संपादन योग्य Word दस्तावेज़ में बदल सकता हूँ?

अभी नहीं। एक स्कैन की गई PDF किसी पेज की छवि होती है जिसमें कोई चुनने योग्य टेक्स्ट नहीं होता, इसलिए Word में फिर से बनाने के लिए कुछ नहीं होता। इसे बदलने के लिए OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) की ज़रूरत होगी, जिसे यह टूल अभी सपोर्ट नहीं करता। जिन PDF में असली, चुनने योग्य टेक्स्ट होता है वे /convert/pdf-to-word पर ठीक से बदल जाती हैं।

मुझे कैसे पता चलेगा कि मेरी PDF स्कैन है या असली टेक्स्ट?

इसे किसी भी रीडर में खोलें और अपने माउस से टेक्स्ट की एक लाइन चुनने की कोशिश करें। अगर अलग-अलग शब्द हाइलाइट होते हैं और आप उन्हें कॉपी कर सकते हैं, तो यह असली टेक्स्ट है और बदल जाएगा। अगर आप सिर्फ़ पेज पर एक बॉक्स बना सकते हैं और कुछ भी टेक्स्ट के रूप में हाइलाइट नहीं होता — या ज़ूम करने पर वह धुंधला दिखता है — तो यह एक स्कैन की गई छवि है और इसे OCR की ज़रूरत है।

मेरी बदली हुई Word फ़ाइल खाली निकली। क्या हुआ?

PDF लगभग निश्चित रूप से एक स्कैन है (किसी पेज की छवि), जिसमें पढ़ने के लिए कोई टेक्स्ट नहीं होता। हमारा टूल इसका पता लगाता है और आपको एक खाली दस्तावेज़ देने के बजाय एक संदेश के साथ रुक जाता है। ऐसी PDF का उपयोग करें जो Word, Google Docs, या किसी समान ऐप से एक्सपोर्ट की गई हो — उनमें असली टेक्स्ट होता है जो बदल जाता है।

क्या Word फ़ाइल बिल्कुल मेरी मूल PDF जैसी दिखेगी?

पत्र और रिपोर्ट जैसे सादे, टेक्स्ट-आधारित दस्तावेज़ों के लिए, यह आमतौर पर बहुत करीब दिखती है — टेक्स्ट, फ़ॉन्ट आकार, और बोल्ड/इटैलिक बने रहते हैं, और पैराग्राफ़ फिर से बन जाते हैं। जटिल बहु-कॉलम लेआउट और भारी टेबल के लिए, शब्द तो आ जाते हैं लेकिन सटीक लेआउट खिसक सकता है, इसलिए आगे भेजने से पहले .docx को Word में देखें और साफ़ करें।

क्या PDF to Word कन्वर्ज़न मुफ़्त और निजी है?

हाँ। यह 100% आपके ब्राउज़र में चलता है, इसलिए आपकी फ़ाइल कभी किसी सर्वर पर अपलोड नहीं होती — यह पूरे समय आपके डिवाइस पर ही रहती है। कोई साइनअप नहीं, कोई वॉटरमार्क नहीं, और कोई दैनिक सीमा नहीं।

और लेख