OCR PDF Çevrimiçi — Ücretsiz, Taranmış PDF'leri Aranabilir Yap, Kayıt Gerekmez
Taranan PDF'lere aranabilir bir metin katmanı eklemek için optik karakter tanıma (OCR) kullanın. Herhangi bir görüntü tabanlı belgeden metni seçin ve kopyalayın. Ücretsiz, Tesseract destekli.
› OCR PDF
✅ Dosya indirmeye hazır!
Bir PDF'de OCR Nasıl Çalıştırılır —
Taranan PDF'ler yalnızca resimlerdir; herhangi bir metni arayamaz, seçemez veya kopyalayamazsınız. PdfDocShift, her sayfayı analiz etmek ve görünmez, aranabilir bir metin katmanı eklemek için en yaygın kullanılan açık kaynaklı OCR motoru olan Tesseract OCR'yi kullanır. Sonuç, orijinaliyle aynı görünen, tamamen aranabilir bir PDF'dir.
Daha fazla PDF aracı,
İhtiyacınız olan tüm PDF işlemleri — tek tık uzakta.
Üç adım,
Kayıt gerekmez. Dosyalar aktarım sırasında şifrelenir ve 2 saat sonra otomatik olarak silinir.
OCR Nedir ve Neden İhtiyacınız Var?
OCR, Optik Karakter Tanıma anlamına gelir. Fiziksel bir belgeyi taradığınızda sonuç esasen bir fotoğraf olan bir PDF'dir — metin gerçek seçilebilir karakterler değil, bir görüntüdür. Onu arayamaz, metin kopyalayamaz veya ekran okuyucularla kullanamazsınız. OCR, görüntüyü piksel piksel analiz eder ve karakterleri, kelimeleri ve paragrafları tanımlar, ardından görünür görüntünün arkasına bir metin katmanı yerleştirir. Sonuç orijinal taramayla aynı görünür ancak tamamen aranabilir, kopyalanıp yapıştırılabilir ve erişilebilirdir. Bu, taranan sözleşmeler, arşivlenmiş kayıtlar, taranan kitaplar, tarihi belgeler ve programatik olarak çalışmanız gereken herhangi bir dijitalleştirilmiş evrak için gereklidir.
OCR Doğruluğunu Ne Etkiler?
Üç faktör OCR doğruluğunu domine eder. İlk olarak, scan resolution: 300 DPI mükemmel sonuçlar üretir; 150 DPI genellikle zar zor kabul edilebilir; bunun altındaki herhangi bir şey karakterleri kaybeder. İkinci olarak, contrast: siyah-beyaz kontrast en iyi çalışır; sararmış veya soluklaşmış sayfalar doğruluğu azaltır. Üçüncü olarak, font clarity: Times Roman gibi standart serif yazı tipleri neredeyse mükemmel şekilde tanınır; el yazısı veya bitişik yazı tipleri insanlar için bile okunmaz olabilir.
OCR Sonrası — Arama ve Düzenleme
OCR tamamlandığında, çıkış PDF i herhangi bir PDF görüntüleyicide tam olarak aranabilir — herhangi bir kelimeyi veya cümleyi aramak için Ctrl+F (Mac te Cmd+F) kullanın. Tanınan metin ayrıca seçilebilir ve kopyalanabilir. Metni tamamen düzenlenebilir biçimde istiyorsanız, hemen ardından PDF to Word aracını kullanarak OCR uygulanmış PDF i Word e dönüştürün. OCR un %100 mükemmel olmadığını unutmayın — özel isimler, teknik terimler ve olağandışı biçimlendirme, belgenin profesyonel bir bağlamda kullanılmadan önce manuel düzeltme gerektirebilir.
OCR PDF
OCR PDF'i çevrimiçi ücretsiz kullanım hakkında bilmeniz gereken her şey.
OCR (Optik Karakter Tanıma), resimlerdeki metni okur ve PDF'nize aranabilir bir metin katmanı ekler. Taranan PDF'ler yalnızca görüntülerdir; OCR'dan sonra metni arayabilir, kopyalayabilir ve düzenleyebilirsiniz.
PdfDocShift'in OCR aracı İngilizce, Almanca, Fransızca ve İspanyolca'yı desteklemektedir. OCR motoru (Tesseract), dilden bağımsız olarak metni otomatik olarak algılar ancak doğruluk, desteklenen diller için en iyisidir.
OCR süresi sayfa sayısına ve tarama kalitesine bağlıdır. Tipik 10 sayfalık taranmış bir belge 15-30 saniyede tamamlanır. Çok büyük belgeler (100+ sayfa) 2 dakika kadar sürebilir.
Hayır. OCR, mevcut sayfa görüntülerinin altına görünmez bir metin katmanı ekler. Her sayfanın görsel görünümü tamamen aynı kalır; yalnızca aranabilirlik ve metin seçimi eklenir.