oniwaban-dev/oniwaban
GitHub: oniwaban-dev/oniwaban
一个受 Sakana AI 启发的个人规模多角色代码模型培育框架,通过 abliteration、模型合并和 multi-LoRA 热替换将开源代码模型派生为测试生成、安全审计等专精角色。
Stars: 0 | Forks: 0
# Oniwaban
multi-agent システムで使う **「ロール特化モデル」を個人スケールで育成するためのキット**。
[Sakana AI](https://sakana.ai/) の効率的モデル開発思想にインスパイアされ、フロンティア基盤モデルの事前学習に対抗するのではなく、既存OSSモデルを **abliteration / mergekit / multi-LoRA hot-swap** で派生させて、特定ロール(フォーマッター・テスター・セキュリティレビュアー等)に特化させる手法をパイプライン化する。
## キットの3層構造
1. **Role 抽象**: 「フォーマッター」「テスター」のような **ロールを first-class** で扱う。各ロールは責務 / 入出力 / 評価基準 / 訓練データ仕様を YAML で宣言
2. **Base Agility**: 特定 base モデルに密結合せず、宣言的 manifest と recipe で base を差替可能。LLM の世代交代に追従する
3. **Pipeline as Code**: abliteration → merge → role-specific LoRA → eval → deploy を justfile + 宣言的 recipe で記述。1コマンドで全派生を再生成
**永続資産は派生モデル本体ではなく Pipeline / Role 定義 / Eval / Loop / API Surface**。新世代 base がリリースされれば 1 コマンドで全派生を再生成して切り替える。
## 「ロール」の時代変化への対応
「どのロールが個人スケールのローカル LLM で実現可能か」は、ベースモデルの能力向上と共に拡張していく:
| 時期 | 射程内のロール |
|---|---|
| **現在** | フォーマッター、テスター、セキュリティレビュアー(パターン認識・構造化タスク中心) |
| **近未来(〜2年)** | コーダー(実装ロール)、ドキュメンタリスト |
| **遠い将来(楽観)** | 設計責任者、テクニカルリーダー |
oniwaban のスコープは **「現時点でローカル実現可能なロール」を発見し、それらを再現可能に育成する** こと。ロール定義そのものが時代と共に進化する前提で設計する。
## ステータス
🚧 **Phase 0(基盤構築)— 進行中**
| Phase | 期間目安 | 内容 |
|---|---|---|
| 0 | Week 0-2 | bake-off / eval harness / abliteration tooling |
| 1 | Week 3-6 | v0.1(abliteration + mergekit、multi-agent system 統合) |
| 2 | Week 7-18 | Multi-LoRA 訓練(言語特化バンドル) |
| 3 | Week 19-26 | 自己改善ループ |
| 4 | Week 27-32 | Tool use 学習 |
| 5 | Week 33-40 | v1.0 仕上げ |
## 同梱する Reference Roles(初期実装スコープ)
キットの動作確認用に以下の reference role 定義を同梱予定。利用者は同形式で独自ロールを追加できる。
| Role | 責務 | 評価軸 |
|---|---|---|
| `tester` | コードに対する単体・結合テスト生成 | コンパイル成功率 / テスト実行成功率 / mutation kill rate |
| `formatter` | 差分要約・コード整形・コミットメッセージ生成 | フォーマット規則順守率 / 意味保存率 |
| `security-reviewer` | コード脆弱性監査・改善提案 | 既知 CVE パターン検出率 / 偽陽性率 |
| `coder`(実験段階) | 実装タスクの遂行 | 仕様充足率 / テスト通過率 |
**カバー対象言語/フレームワーク**: Python, Django, Wagtail, TypeScript, React, Rust, Go, Flutter (Dart)
各 role × 言語の組み合わせを LoRA として育成する(独立 LoRA + hot-swap)。
## 技術スタック
| 区分 | 採用 |
|---|---|
| Base model 候補 | Qwen2.5-Coder-7B-Instruct(第一候補、Phase 0 の bake-off で確定) |
| 訓練手法 | LoRA / QLoRA, model merging (mergekit), abliteration |
| 訓練フレームワーク | axolotl / unsloth / mlx-lm |
| 推論 | llama.cpp / ollama / vLLM |
| Eval | lm-evaluation-harness + 自作 multi-language harness |
| 言語 | Python 3.12(uv 管理) |
## 統合パターン
oniwaban は **OpenAI 互換 HTTP API** を contract として持つため、特定のシステムに依存しない。想定される統合パターン:
| 利用シーン | 統合コスト |
|---|---|
| Discord ベース multi-agent システム | adapter 1ファイル(既存の Provider 切替機構に乗る) |
| IDE 拡張(Continue.dev / Cursor 等) | 設定欄に base URL 入れるだけ |
| OSS CLI(aider / cline / open-interpreter 等) | `OPENAI_API_BASE` 環境変数のみ |
| GitHub Actions 自動化 | curl で叩くだけ |
| 任意の OpenAI SDK 利用コード | base URL 1行変更 |
詳細な統合手順は [integration-patterns.md](docs/architecture/integration-patterns.md) を参照。
## 学習用 Wiki
AI 開発の前提知識から oniwaban の設計思想まで、**高校生でも読める語り口** で解説した学習用 Wiki を別途用意:
📚 **[Wiki トップ →](https://github.com/oniwaban-dev/oniwaban/wiki)**
カテゴリ:基礎(Transformer / 量子化 / MoE)、学習手法(LoRA / 蒸留 / マージ / abliteration)、ツール(ollama / vLLM / axolotl / mergekit)、設計思想、運用インフラ、会話メモ — 全 35 記事。
## 設計ドキュメント
| ドキュメント | 内容 |
|---|---|
| [overview.md](docs/architecture/overview.md) | 全体設計とロードマップ |
| [model-build-pipeline.md](docs/architecture/model-build-pipeline.md) | base 差替可能な model build pipeline 仕様 |
| [role-abstraction.md](docs/architecture/role-abstraction.md) | Role 抽象と reference roles |
| [integration-patterns.md](docs/architecture/integration-patterns.md) | 外部システムからの統合パターン |
## 開発フロー
# 環境構築
just sync
# 品質チェック
just lint
just typecheck
just test
# 全部まとめて
just check
## ライセンス
[Apache-2.0](LICENSE)
派生モデルは base model のライセンスに従う(各モデルのリリース時に MODEL_CARD.md で個別記載予定)。
## 関連
- [shikomi](https://github.com/shikomi-dev/shikomi) — Rust 製プロジェクト(Rust LoRA の検証対象)
标签:Abliteration, AI编程助手, Black Hat, DevSecOps, LLM, LoRA, mergekit, MLOps, Multi-Agent, Multi-LoRA, Offensive Security, Pipeline as Code, Qwen-Coder, Sakana AI, Unmanaged PE, 上游代理, 个人AI, 人工智能, 代码审查, 代码生成, 多Agent系统, 多语言编程, 大型语言模型, 安全审查, 开源框架, 开源模型, 持续集成, 本地大模型, 本地部署, 模型优化, 模型合并, 模型定制, 模型微调, 渗透测试工具, 用户模式Hook绕过, 网络安全, 自动化流水线, 角色特化, 软件开发, 逆向工具, 隐私保护