unicode-org/unihan-database
GitHub: unicode-org/unihan-database
这是一个用于专家协作审查和编辑Unihan汉字数据库草案的专用工具。
Stars: 79 | Forks: 8
# Unihan 数据库
本仓库旨在供专家审查 Unihan 数据库的草拟更改、删除和新增内容。
当前正在处理的每个临时 Unihan 数据库属性都有其独立的数据文件。目前包括:
- [kCantonese](https://unicode.org/reports/tr38/#kCantonese).txt
- [kDefinition](https://unicode.org/reports/tr38/#kDefinition).txt
- [kMeyerWempe](https://unicode.org/reports/tr38/#kMeyerWempe).txt
- [kPhonetic](https://unicode.org/reports/tr38/#kPhonetic).txt
- [kSemanticVariant](https://unicode.org/reports/tr38/#kSemanticVariant).txt
- [kSimplifiedVariant](https://unicode.org/reports/tr38/#kSimplifiedVariant).txt
- [kSpecializedSemanticVariant](https://unicode.org/reports/tr38/#kSpecializedSemanticVariant).txt
- [kSpoofingVariant](https://unicode.org/reports/tr38/#kSpoofingVariant).txt
- [kTraditionalVariant](https://unicode.org/reports/tr38/#kTraditionalVariant).txt
- [kZVariant](https://unicode.org/reports/tr38/#kZVariant).txt
额外包含的文件有:
*AlternateRadicals.txt* 列出了一些字符,这些字符在类似 Unicode 的部首笔画索引中可能被合理地查找为多个不同的部首笔画值。不包括部首相同但笔画数仅有细微差异的情况。为便于编辑,通常会显示部首所代表的字符,*例如:*
`U+61D5 懕 ⼼ 61.14 ⼚ 27.16`
在所有情况下,第一个值应被视为 [UAX #38](https://www.unicode.org/reports/tr38/#kRSUnicode) 中定义的标准值。
简体部首未作标注。
*CantoneseLookup.txt* 是为 `kCantonese` 属性的编辑人员提供的辅助工具,包含已知存在粤语读音但尚未得到权威来源确认的汉字。
对非临时属性的更改需要获得 UTC 的批准。因此,请求更改非临时属性的适当方式是 [准备并提交提案](https://www.unicode.org/pending/docsubmit.html),或通过 [联系表单](https://corp.unicode.org/reporting.html) 提交反馈,而不是提交拉取请求或在本仓库中创建新议题。
`U+4E95 井 kCantonese zeng2`
一般性讨论或请求将其他属性数据文件添加到本仓库,请使用 Unicode 联盟 Slack 组织中的 `#unihan` 频道。
有关 *kCantonese* 属性值的讨论,请使用 Unicode 联盟 Slack 组织中的 `#cantonese` 频道。
### 版权与许可
版权所有 © 2021-2025 Unicode, Inc. Unicode 和 Unicode 徽标是 Unicode, Inc. 在美国和其他国家的注册商标。
贡献本项目需要签署 CLA - 详情请参阅 [CONTRIBUTING.md](https://github.com/unicode-org/.github/blob/main/.github/CONTRIBUTING.md) 文件(或启动一个拉取请求)。
本仓库内容受 Unicode [使用条款](https://www.unicode.org/copyright.html) 约束,并根据 [LICENSE](./LICENSE) 发布。
标签:Unicode标准, 专家评审, 信息技术, 多语言支持, 字符属性, 字符编码, 安全测试框架, 审查流程, 属性管理, 技术标准, 数据审查, 数据文件, 数据管理, 汉字处理, 汉字数据库, 网络安全研究, 草案管理, 语义变体, 语言变体, 语言学