it-swarm.asia

Unicode metni Notepad ++ ile nasıl düzenleyebilirim?

Bazen Unicode karakterler içeren İngilizce metinleri düzenlerim. Nedense, benim bilgisayarımda, Notepad ++ dönüştürür nicode karakterleri - ??? böylelikle metni bozar ve tüm bu verileri kaybeder. Unicode karakterleri korurken, bu metni düzenlemenin bir yolunu arıyorum. Yazı tipim olarak Consolas kullanıyorum. Yazı tipinde bu karakterlerin tümü yoksa, metni Not Defteri ++ öğesinden kopyaladığımda neden veriyi kaybedeyim?

25
Robinicks

Dosya gerçekten Unicode'da kodlanmışsa, Notepad ++ otomatik olarak algılamalıdır. Consolas font benim için iyi çalışıyor. Bu iki menü seçeneğinden birini deneyebilirsiniz:

  • Kodlama -> UTF-8’de kodlayın
  • Kodlama -> UTF-8’e dönüştürün

Birinin istediğini yapacağına eminim.

14
DisgruntledGoat

Soruda açıklanan sorun, bir empty/new belgesi "ANSI" olarak ayarlandığında ve nicode karakterleri yapıştığında gerçekleşir.

Boş/yeni bir belge ile kullanıldığında, en azından üzerinde test ettiğim Notepad ++ sürümünde kullanıldığında herhangi bir otomatik algılama yoktur. "ANSI", menüde Ayarlar -> Tercihler -> sekmesi Yeni Belge/Yeni Dizini Kaydet/Dizini Kaydet .

Çözüm

Çözüm, kodlamayı TF-8 yapıştırmadan önce ayarlamak, menü Format ​​-> TF-8'de kodla olarak ayarlamaktır.

Menu command "menu Format/Encode in UTF-8" about to be executed

Örnek

Bazı metinleri yeni bir Not Defteri ++ belgesine kopyaladım, Rusça (русский язык, russkiy yazyk), Firefox’tan Wikipedia sayfasını gösteren Russian language.

Kodlama değil "ANSI" den değiştirilmişse, sonuç şu:

Result of pasting the Unicode string "Russian (русский язык, russkiy yazyk" into a new Notepad++ document without changing the encoding from the default "ANSI".

Eğer kodlama is değiştiyse sonuç budur:

Result of pasting the Unicode string "Russian (русский язык, russkiy yazyk" into a new Notepad++ document after changing the encoding from the default "ANSI" to "UTF-8".

Aşağıdaki şekilde görülebileceği gibi ( Kiril kısım vurgulanmıştır), Notepad ++ aslında Unicode karakterleri ASCII 63 (onaltılık 3F), soru işaretlerine dönüştürür. Bu nedenle, metin panodan kopyalanırken Unicode karakterlerin kaybolması ("ANSI" modunda) (bu [değil yazı tipi sorunu - bilgi kaybolur).

Screenshot of a hex view of said document

Üzerinde test edildi: Notepad ++ v5.4.5 (UNICODE).

14
Peter Mortensen

İyi haberler ve kötü haberler var.

İyi haberler: Notepad ++, Unicode'u destekler (en azından toplayabildiğimden).

Kötü haber: Görünüşe göre Unicode desteği yalnızca Windows XP'de.

Aslında önümde bir Windows makinesi yok. Hatırladığım kadarıyla, bir yerde Format menüsünün altında bir Kodlama menüsü var. Unicode için kodlama aslında en yaygın UTF-8'dir.

İşte Notepad ++ 'da Unicode desteğinin' güzel 'bir resmi,

enter image description here

5
Josh Hunt

Unicode, Windows 7'de mükemmel çalışıyor. Görünen tek sorun, değiştirilen karakterleri yeniden yazmak zorunda olmanız. Başıma geldi. İskandinav harfleriyle yazıyorum bu yüzden ä -> E4, ö -> F6. Hepsini değiştirmek için popo bir acı, ama buna değer.

Bir sayfayı ANSI -> UTF-8'den kodlarsanız, bazı karakter problemleri olacaktır.

Öncelikle UTF-8'de yeni bir sayfa oluşturup daha sonra bilgilerinizi kopyala/yapıştır yapmanı öneririm. O zaman sorun olmaz/olmaz.

3
Sloshed

Bu benim için çalıştı:

Yazı tipini bilgisayarımdaki stil yapılandırıcısında Courier New olarak değiştirdim (Windows 7'de İngilizce/ABD karakter kümesi ve Unicode olmayan küme için Romence). Courier New & Tahoma fontları + UTF-8 kodlaması ile çalışıyor.

1
rapy rapy

Üst menüde Encoding öğesini seçin, ardından Encode in UTF-8 veya Encode in UTF-8 Without BOM öğesini seçin, ardından metni Unicode kodlamasında düzenleyebilirsiniz.

0
Siavash