it-swarm.asia

Bir pdf dosyasından metin kopyalanamıyor

Ders kitabımı görüntülemek için foxit PDF okuyucu kullanıyorum. Metni pdf dosyasından bir Word belgesine kopyalamak istiyorum ancak izin vermiyor. İyi metni seçebilirim ancak metni kopyalama seçeneği kullanılamıyor. Başka belgelerden metin kopyalayabilirim, ancak bazılarını değil. Bu korumayı pencerelerde aşmanın bir yolu var mı?

37
Jonno_FTW

Pdf dosyası muhtemelen metin kopyalamaya karşı kilitlenmiştir. Aşağıda kilidini açmanın iki yolu vardır:

  1. Eğer pdf yazdırmaya karşı kilitlenmemişse, kilidi açılmış bir dosyayı oluşturmak için sanal bir pdf yazıcısına yazdırabilirsiniz. Bunu gör:
    "Şifreyi Kaldır ve Korumanın Kilidini Aç PDF Hangi Sırrı Bilmeden Yazdırılmaya İzin Verilir" .
  2. Yazdırma işlevi kilitlenmişse, şuna bakın:
    "Kısıtlamaları Kaldır ve Şifreyi Koru Şifreli PDF PDF Unlocker İçeren Dosyalar" .
28
harrymc
  1. PDF öğesini Google Chrome'da açın (PDF dosyasını Chrome'a ​​sürükleyip bırakın).
  2. Belirli bir sayfayı PDF olarak yazdırın veya yalnızca baskı önizlemesini açın.
  3. Artık metni önizlemeden veya çıktı PDF'den kopyalayabilirsiniz. Ama masayı doğrudan kopyalayabileceğini sanmıyorum.
24
Khaleel

Ghostscript (Windows için kullanılabilir) kullanarak PDF dosyanızın DRM'siz bir sürümünü oluşturabildim.

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

Sonuçta ortaya çıkan stripped.pdf dosyası Adobe Reader'a yüklenebilir ve Reader, istediğiniz herhangi bir bölümünü kopyalamanıza izin verecektir. Ayrıca, tablonun biçimlendirmesinin çoğunu da korur.

11
Michael Hampton

Tabloyu, Okular (Linux için; KDE'nin bir parçası) kullanarak başarılı bir şekilde PDF dosyanızdan kopyalayabildim. Bunu yapmak için Okular’ın ayarlarına girip "DRM kısıtlamalarına uy" seçeneğinin işaretini kaldırmak zorunda kaldım.

Bunun Windows kullandığınızdan beri size gerçekten yardımcı olmadığının farkındayım, ancak kullanışlı bir Linux makineniz varsa ya da kurmaya istekliysanız bir olasılık olabilir.

Maalesef, biçimlendirmesi olmayan düz bir metindi, ancak tabloyu yeniden oluşturmak çok zor olmamalı gibi görünüyordu. Kopyala ve yapıştır maceramın sonuçlarını görebilirsiniz burada .

2
Michael Hampton

GT Text'i kullanabilirsiniz, görüntüleri (ayrıca pdf snapshots = image) metne çeviren bir programdır. Alanı seçebilir ve panoya kopyalar Bu ücretsiz

Resmi ana sayfa http://gttext.googlecode.com

1
David

Başka bir olasılık ise Evince .

Windows'ta , varsayılan olarak kopyalamayı destekliyor gibi görünüyor.

Linux'ta kopyalama, eğer zaten değilse, override_restrictions ayarını kontrol ederek etkinleştirilebilir, bu talimatlar (dconf-editor/org/gnome/evinceoverride_restrictions).

0
endolith

eğer kopya grileşmişse, şüphe sizin için olduğu gibi, o zaman PDF 'kilitli' olabilir, okunabilir, ancak gerçekten de bir şeyi kopyalamanız/yapıştırmanızdan alıkoymaktadır.

Bu web sitesi bir PDF'nin kilidini açacak

https://smallpdf.com/unlock-pdf

0
barlop

Bu, temel metni dönüştürmeyi başardı. Ancak tablolarla boğulmuş.

http://www.onlineocr.net/documents

0
Rob Sedgwick

Yalnızca kısa snippet'ler arıyorsanız, genellikle alıntı işaretlerinin içine google’a birkaç kelime yazabilir ve daha önce başka bir biçimde taranmış veya başka bir kişi tarafından yazılmış tam teklifi bulabilirsiniz.

Diğer bir seçenek de, metni Google’da OCR’a koyacak olan Google Dokümanlar Android uygulamasındaki "Fotoğraftan Doküman" dır. Bu elbette hataya açık.

Keşke PDF kilitleme işlevi hiç olmamıştı. :(

0
endolith

Endolith için cevap:

PDF cihazınız kopyalamaya karşı korumalıdır, ancak yazdırmaya karşı korumalıdır.

Bu yüzden, tablo 6.15'i içeren bir sayfayı başka bir PDF içine yazdırdım, seçmedim ve kopyalamaya karşı korumalı olmayan, sonra Word'e yapıştırdım. Şaşırtıcı bir şekilde, macunun sonucu tamamen berbattı.

Şimdi bu tabloya daha fazla baktım ve çok şaşırtıcı bir sonuç buldum: Bu bir masa değil!

Aslında, sayfaya bir tablo gibi görünecek şekilde yerleştirilmiş küçük metin parçalarının bir montajı. Ancak bu gerçek bir masa değil.

Yapabileceğiniz en iyi şey, her şeyi bir tablo olarak yeniden yazmak veya çalışmanızda yalnızca bu tablo benzeri birleştirilmiş metnin ekran görüntüsünü kullanmaktır.

İşte tablonun ekran görüntüsü, benim oluşturulan bir sayfalık pdf belgesinden alındığı gibi:

image

0
harrymc