
套用一句流行語來形容現今中文平台的狀況,就是:中文的內碼特別多。大概地數一數,較有名氣的就有十來種之多。在Internet
盛行之今日,中文內碼未能統一,瀏覽不同內碼的中文網站、網頁,常常看到一堆不知所云的亂碼,接發中文電子郵件更是如此。統一全球中文的內碼已刻不容緩。
台灣的中文系統中比較常用是BIG 5,大陸的中文系統則是「國家標準」的天下,主要使用的內碼為《信息交換用漢字編碼字符集--
基本集》、《信息交換用漢字碼字元集-- 輔助集》、並新增加 35
個圖形符號和 103 個漢字等,還有《漢字擴展內碼規範》-- GBK。
ISO10646則是由國際標準化組織制定的編碼標準,而UNICODE
則是由非盈利的電腦組織UNICODE研討會負責維護和改進的一種字符編碼。
ISO10646 及UNICODE 的字碼架構:它們均為多國語文內碼系統。ISO10646之漢字碼長度:4
BYTE,UNICODE 之漢字碼長度:2 BYTE,新版UNICODE之漢字碼長度:2-4 BYTE。作業系統的主要廠商微軟已在Windows
98 中不聲不響的使用了新版UNICODE。另外資訊業界的一些大公司如Apple、HP、IBM、Lotus、Novell、Sybase
等亦是UNICDOE研討會的成員,在他們的產品中也已經或即將支援UNICODE。
看來,中文地區交流電子資訊所用的編碼統一到UNICODE
已是大勢所趨,中文平台的混亂狀況能否就此歸於平靜呢?不過在目前,這還是一個未知數,不過有一點可以肯定,跟隨UNICODE不會錯。
全文「中文的內碼特別多」刊載於香港CNET--「IT透視鏡」專欄之『漢化電腦』專題,本網頁僅是該文之摘錄部分。特此感謝「香港cnet」!
附:『專題報導』-CNET在亞洲
[返回上頁] |