关于操作系统和编码支持的疑问

1个回答

大飘子

2026-01-23 23:12

linux
linux

随缘助力前行。以zip为例，它诞生于1989年，其多语言支持取决于操作系统的兼容性。在UTF-8出现之前，已经存在多种多字节字符编码方案。但无论怎样，POSIX（Unix）API始终只支持const char*类型及以0结尾的字节序列，并且明确规定char为8位。因此，像linux和BSD这样的系统内核无法采用ISO 10646的UCS-2编码，也无法使用Unicode 1.0中的定长编码方式。尽管ISO 10646提出了多字节变长编码UTF-1，但由于其编解码过程过于复杂，且缺乏抗损坏纠正能力，该编码从未在实际应用中得到推广或使用。这就是推动UTF-8诞生的主要原因。

也就是说，这些操作系统（内核与驱动）并未采用UTF-8。只要编码与ASCII兼容，就能直接处理，但这并不意味着程序能显示该编码的字符（如zip），仅是处理方式未受影响。我以前回答过为什么UTF-16无法取代UTF-8的问题。所有本地化功能由libc（即locale）和软件自身实现，然而locale无法正确处理字符编码，毫无例外全都出错。当前C语言标准的编者如此评价locale：

举报有用（0）分享收藏

关于操作系统和编码支持的疑问

1个回答

大飘子

热门话题

相关问题