moazabeer/Asteroid-Threat-Intelligence-System-ATIS-Explainable-AI-for-Hazardous-Near-Earth-Object-Prediction
GitHub: moazabeer/Asteroid-Threat-Intelligence-System-ATIS-Explainable-AI-for-Hazardous-Near-Earth-Object-Prediction
ATIS是一个基于可解释人工智能与集成学习的小行星威胁情报系统,用于预测潜在危险近地天体并解释关键轨道特征。
Stars: 0 | Forks: 0
# 小行星威胁情报系统 (ATIS) ☄️🤖
### 用于危险近地天体预测的可解释人工智能
小行星是重要的天体,对其进行跟踪与分类对于行星防御至关重要。**ATIS** 是一个端到端的机器学习管道,旨在利用最先进的梯度提升算法与可解释人工智能(XAI)来预测潜在危险小行星(PHA),从而实现透明的决策过程。
## 🚀 功能特性
- **自动数据检索**:使用 `kagglehub` 下载最新小行星数据。
- **高级预处理**:鲁棒处理缺失值、轨道参数编码与特征选择。
- **类别不平衡处理**:利用 **SMOTE**(合成少数类过采样技术)解决数据集中危险小行星稀少的问题。
- **高性能模型**:实现并比较多种集成架构:
- Random Forest
- XGBoost
- LightGBM
- CatBoost
- **可解释人工智能(XAI)**:集成使用 **SHAP**(SHapley Additive exPlanations)来解释模型预测,并识别关键威胁轨道指标。
- **超参数优化**:使用 **Optuna** 进行自动调优,最大化 F1 分数与 ROC-AUC。
## 🛠️ 技术栈
- **语言:** Python
- **数据处理:** `pandas`, `numpy`
- **机器学习:** `scikit-learn`, `xgboost`, `lightgbm`, `catboost`
- **优化:** `optuna`
- **可解释性:** `shap`
- **可视化:** `matplotlib`, `seaborn`
- **不平衡处理:** `imbalanced-learn`
## 📦 安装说明
要在本地运行本项目,请克隆仓库并安装所需依赖:
```
git clone https://github.com/moazabeer/Asteroid-Threat-Intelligence-System-ATIS-Explainable-AI-for-Hazardous-Near-Earth-Object-Prediction.git
cd Asteroid-Threat-Intelligence-System-ATIS-Explainable-AI-for-Hazardous-Near-Earth-Object-Prediction
python -m pip install --upgrade pip
pip install -r requirements.txt
```
## 📖 使用方法
1. **数据集下载**:脚本通过 `kagglehub` 自动下载数据集。请确保已配置 Kaggle 账户/API 密钥(如需要),或直接运行脚本让 `kagglehub` 处理。
2. **执行**:
python -m src.train
3. **输出**:
- 模型性能指标(准确率、精确率、召回率、F1、AUC)。
- 序列化模型及预处理产物保存在 `models/` 目录下。
- 通过 `python -m src.inference ` 或 `atis-predict ` 生成的 CSV 预测文件。
## 📊 数据集
该系统使用来自 Kaggle 的 **小行星数据集**,包含以下轨道参数:
- `a`:半长轴
- `e`:偏心率
- `i`:轨道倾角
- `q`:近日点距离
- `pha`:潜在危险小行星(目标标签)
## 🔍 可解释性 (SHAP)
理解*为什么*某颗小行星被标记为威胁,与预测本身同样重要。ATIS 使用 SHAP 来可视化近日点距离或绝对星等 H 等特征如何影响模型在威胁评估中的置信度。
## 📄 许可证
本项目基于 [MIT 许可证](LICENSE) 开源。
**免责声明**:本项目仅供教育与研究目的使用。如需官方行星防御数据,请参考 [NASA JPL CNEOS](https://cneos.jpl.nasa.gov/)。
标签:Apex, CatBoost, LightGBM, matplotlib, Mutation, numpy, Optuna, pandas, Python, scikit-learn, seaborn, SHAP, SMOTE, XGBoost, 不平衡分类, 危险小行星预测, 可视化, 可解释AI, 天文学, 太空安全, 小行星威胁, 无后门, 机器学习, 梯度提升, 行星防御, 超参数优化, 近地天体, 逆向工具, 随机森林