Bentuk Normalisasi KC - Casefold
NFKC_CF, berlaku untuk 6317 karakter Unicode, memastikan pemrosesan teks konsisten dan kompatibel secara linguistik. Ini melampaui perubahan kasus tradisional, menggabungkan penyesuaian untuk perbandingan karakter yang seragam. Properti ini sangat penting untuk meningkatkan kompatibilitas di berbagai konteks linguistik dan mendukung pengoperasian teks yang andal.
Braket Berpasangan Bidi
Properti Bidi Paired Bracket disingkat bpb, berlaku untuk 128 karakter Unicode, mengidentifikasi karakter seperti tanda kurung atau tanda kurung sebagai pembentuk tanda kurung berpasangan. Penting untuk rendering teks dua arah, ini memastikan tata letak dan pengurutan yang akurat dalam skrip dengan arah campuran.
Huruf besar
Di Unicode, properti Huruf Besar menandai karakter dengan bentuk huruf besar, penting untuk menjaga kapitalisasi yang konsisten. Properti ini berlaku untuk 1527 karakter Unicode, memfasilitasi pengoperasian peka huruf besar-kecil secara tepat di berbagai skrip dan bahasa.
Huruf Besar Sederhana
Properti Simple Uppercase, disingkat suc, berlaku untuk 1450 karakter Unicode. Ini menunjukkan karakter yang tersedia versi huruf besar langsung. Properti ini menyederhanakan transformasi huruf besar, memastikan keseragaman dan kesederhanaan dalam pemrosesan teks untuk kumpulan karakter tertentu.
Huruf kecil
Di Unicode, properti Huruf Kecil memberi tahu kita karakter mana yang memiliki versi huruf kecil. Ini membantu komputer memahami bagaimana huruf dapat digunakan tanpa mempedulikan penggunaan huruf besar, membuat hal-hal seperti pencarian dan pemrosesan teks menjadi lebih mudah. Properti ini berlaku untuk 1433 karakter Unicode.
Huruf Kecil Sederhana
Properti Huruf Kecil Sederhana, disingkat slc, berlaku untuk 1433 karakter Unicode. Ini secara khusus relevan untuk karakter dengan versi huruf kecil yang tersedia. Properti ini menyederhanakan transformasi huruf kecil, memastikan konsistensi dan kesederhanaan dalam pemrosesan teks untuk kumpulan karakter tertentu.
Ideograf Terpadu Setara
Equivalent Unified Ideograph disingkat EqUIdeo di Unicode memastikan karakter yang terlihat berbeda dengan arti yang sama dianggap setara atau sama. Ini menyederhanakan pemrosesan teks, menjadikannya konsisten dan terstandarisasi di berbagai konteks.
Judul
Properti Title Case di Unicode mengidentifikasi karakter dengan bentuk khusus untuk huruf pertama judul. Penting untuk menggunakan huruf besar yang tepat dalam judul atau judul. Properti ini berlaku untuk 1452 karakter Unicode.
Judul Sederhana
Properti Simple Titlecase, disingkat stc di Unicode berlaku untuk 1404 karakter, memungkinkan transformasi langsung ke bentuk titlecase mereka. Hal ini memfasilitasi penggunaan huruf besar yang konsisten untuk pemformatan judul yang tidak rumit, menyederhanakan pemrosesan teks, dan menyempurnakan presentasi.
Lipat Kasus
Properti Case Folding, disingkat cf, berlaku untuk 1530 karakter Unicode. Ini mencakup transformasi lipat yang komprehensif, membantu pemrosesan teks yang tidak peka huruf besar-kecil. Properti ini memastikan konsistensi dalam operasi perbandingan dan berguna untuk tugas seperti pencarian dan pencocokan pola di berbagai kasus.
Lipat Kasus Sederhana
Properti Simple Case Folding, disingkat scf, berlaku untuk 1454 karakter Unicode. Ini mewakili transformasi langsung ke bentuk kasus terlipat, memastikan keseragaman dalam operasi yang tidak sensitif terhadap huruf besar/kecil. Properti ini berperan penting dalam menyederhanakan tugas seperti pencarian dan pencocokan pola di berbagai kasus.
Mesin Terbang Cermin Bidi
Properti Bidi Mirrored Glyph disingkat bmg di Unicode, berlaku untuk 428 karakter, mengidentifikasi mesin terbang dengan pasangan cermin dalam teks dua arah. Karakter-karakter ini berubah secara visual ketika muncul dalam konteks kanan ke kiri, memastikan rendering visual yang tepat dan keterbacaan dalam skrip dengan arah yang beragam.
Pemetaan Dekomposisi
Properti Dekomposisi disingkat dm, berlaku untuk 17029 karakter Unicode, mengacu pada cara karakter dapat dipecah menjadi bagian-bagian penyusunnya. Hal ini penting untuk normalisasi teks dan kompatibilitas di berbagai skrip.
Pengecualian Komposisi Penuh - Formulir Normalisasi KC
Properti Pengecualian Komposisi Penuh di Unicode, disingkat FC_NFKC, berlaku untuk 637 karakter Unicode. Properti ini mengidentifikasi karakter yang dikecualikan dari komposisi penuh selama normalisasi menggunakan Formulir Normalisasi KC yang penting untuk pemrosesan dan pengkodean teks yang akurat