Raynaldi-DC/Natural-Language-Processing
GitHub: Raynaldi-DC/Natural-Language-Processing
一个NLP项目集合,涵盖网络安全威胁情报报告转换为MITRE ATT&CK格式、客户服务文本分类、信息提取以及TTS生成等场景的实践方案。
Stars: 0 | Forks: 0
# 🗣️ 自然语言处理 (NLP)
本仓库包含与**自然语言处理 (NLP)** 和基于文本的机器学习相关的项目。主要专注于处理和分析非结构化的、人类生成的文本(自然语言)。
## 📁 项目列表
### 📌 NLP : [网络安全威胁情报报告转 MITRE](https://github.com/Raynaldi-DC/Natural-Language-Processing/tree/main/Cyber-Threat-Intelegence)
- 使用 NLP 技术将网络安全威胁情报 (CTI) 报告转换为 Mitre ATT&CK 格式。
- 使用技术:`Scikit-learn`、`PyTorch`、`Transformers (BERT)`
- 基于 [MITRE CTID](https://ctid.mitre.org/projects/threat-report-attck-mapper-tram) 发布内容的个人项目。
### 📌 NLP : [客户服务主题分类](https://github.com/Raynaldi-DC/Natural-Language-Processing/tree/main/Customer-Service-Topic-Classification)
- 将客户服务查询分类到预定义的类别中。
- 使用技术:`Scikit-learn`、`Transformers (BERT)`、`Regex`
- 为 **Astra Insurance** 开发的项目。
### 📌 模糊匹配 : [从文本中匹配和提取数据](https://github.com/Raynaldi-DC/Natural-Language-Processing/tree/main/Extract-Data-From-Text)
- 从非结构化文本中匹配和提取结构化信息,例如价格、疾病名称等。
- 使用技术:`Regex`、`Fuzzy Matching`
- 为 **Astra Insurance** 开发的项目。
### 📌 TTS : [使用 Transformer 的文本转语音](https://github.com/Raynaldi-DC/Natural-Language-Processing/tree/main/TTS-Transformer)
* 将文本转换为语音,并通过简单的 API 端点提供服务。
* 使用技术:`Transformers`、`PyTorch`、`Flask`、`Ngrok`
* 用于探索**基于 Transformer 的音频生成**的个人项目。
### 📌 TTS : [Pytorch 与 ONNX 延迟对比](https://github.com/Raynaldi-DC/Natural-Language-Processing/tree/main/TTS-Latency-Comparison)
* 对文本转语音的 PyTorch 和 ONNX 模型进行推理延迟的基准测试与比较。
* 使用技术:`PyTorch`、`ONNX`、`ONNX Runtime`、`Transformers`
* 用于探索**模型优化和推理性能**的个人项目。
## 🌐 其他领域
[| 作品集主页 |](https://github.com/Raynaldi-DC/Portofolio)
- [🗣️ 自然语言处理 (NLP)](https://github.com/Raynaldi-DC/Natural-Language-Processing)
- [🧠 监督学习](https://github.com/Raynaldi-DC/Supervised-Learning)
- [📊 无监督学习](https://github.com/Raynaldi-DC/Unsupervised-Learning)
- [📈 时间序列](https://github.com/Raynaldi-DC/Time-Series)
## 导航
[| 主菜单 ](https://github.com/Raynaldi-DC)[| 个人简历 ](https://github.com/Raynaldi-DC/Resume)[| 证书 ](https://github.com/Raynaldi-DC/Certificates)[| 作品集主页 |](https://github.com/Raynaldi-DC/Portofolio)
标签:Apex, API服务, BERT, Cloudflare, CNCF毕业项目, Flask, MITRE ATT&CK, NLP, ONNX, PyTorch, Scikit-learn, TTS, 人工智能, 凭据扫描, 威胁情报, 开发者工具, 性能测试, 推理延迟, 文本分析, 文本分类, 文本提取, 机器学习, 模糊匹配, 深度学习, 用户模式Hook绕过, 系统调用监控, 网络安全, 语音合成, 逆向工具, 隐私保护, 非结构化数据