oniwaban-dev/oniwaban

GitHub: oniwaban-dev/oniwaban

一个受 Sakana AI 启发的个人规模多角色代码模型培育框架，通过 abliteration、模型合并和 multi-LoRA 热替换将开源代码模型派生为测试生成、安全审计等专精角色。

Stars: 0 | Forks: 0

# Oniwaban multi-agent システムで使う **「ロール特化モデル」を個人スケールで育成するためのキット**。 [Sakana AI](https://sakana.ai/) の効率的モデル開発思想にインスパイアされ、フロンティア基盤モデルの事前学習に対抗するのではなく、既存OSSモデルを **abliteration / mergekit / multi-LoRA hot-swap** で派生させて、特定ロール（フォーマッター・テスター・セキュリティレビュアー等）に特化させる手法をパイプライン化する。 ## キットの3層構造 1. **Role 抽象**: 「フォーマッター」「テスター」のような **ロールを first-class** で扱う。各ロールは責務 / 入出力 / 評価基準 / 訓練データ仕様を YAML で宣言 2. **Base Agility**: 特定 base モデルに密結合せず、宣言的 manifest と recipe で base を差替可能。LLM の世代交代に追従する 3. **Pipeline as Code**: abliteration → merge → role-specific LoRA → eval → deploy を justfile + 宣言的 recipe で記述。1コマンドで全派生を再生成 **永続資産は派生モデル本体ではなく Pipeline / Role 定義 / Eval / Loop / API Surface**。新世代 base がリリースされれば 1 コマンドで全派生を再生成して切り替える。 ## 「ロール」の時代変化への対応「どのロールが個人スケールのローカル LLM で実現可能か」は、ベースモデルの能力向上と共に拡張していく： | 時期 | 射程内のロール | |---|---| | **現在** | フォーマッター、テスター、セキュリティレビュアー（パターン認識・構造化タスク中心） | | **近未来（〜2年）** | コーダー（実装ロール）、ドキュメンタリスト | | **遠い将来（楽観）** | 設計責任者、テクニカルリーダー | oniwaban のスコープは **「現時点でローカル実現可能なロール」を発見し、それらを再現可能に育成する** こと。ロール定義そのものが時代と共に進化する前提で設計する。 ## ステータス 🚧 **Phase 0（基盤構築）— 進行中** | Phase | 期間目安 | 内容 | |---|---|---| | 0 | Week 0-2 | bake-off / eval harness / abliteration tooling | | 1 | Week 3-6 | v0.1（abliteration + mergekit、multi-agent system 統合） | | 2 | Week 7-18 | Multi-LoRA 訓練（言語特化バンドル） | | 3 | Week 19-26 | 自己改善ループ | | 4 | Week 27-32 | Tool use 学習 | | 5 | Week 33-40 | v1.0 仕上げ | ## 同梱する Reference Roles（初期実装スコープ）キットの動作確認用に以下の reference role 定義を同梱予定。利用者は同形式で独自ロールを追加できる。 | Role | 責務 | 評価軸 | |---|---|---| | `tester` | コードに対する単体・結合テスト生成 | コンパイル成功率 / テスト実行成功率 / mutation kill rate | | `formatter` | 差分要約・コード整形・コミットメッセージ生成 | フォーマット規則順守率 / 意味保存率 | | `security-reviewer` | コード脆弱性監査・改善提案 | 既知 CVE パターン検出率 / 偽陽性率 | | `coder`（実験段階） | 実装タスクの遂行 | 仕様充足率 / テスト通過率 | **カバー対象言語/フレームワーク**: Python, Django, Wagtail, TypeScript, React, Rust, Go, Flutter (Dart) 各 role × 言語の組み合わせを LoRA として育成する（独立 LoRA + hot-swap）。 ## 技術スタック | 区分 | 採用 | |---|---| | Base model 候補 | Qwen2.5-Coder-7B-Instruct（第一候補、Phase 0 の bake-off で確定） | | 訓練手法 | LoRA / QLoRA, model merging (mergekit), abliteration | | 訓練フレームワーク | axolotl / unsloth / mlx-lm | | 推論 | llama.cpp / ollama / vLLM | | Eval | lm-evaluation-harness + 自作 multi-language harness | | 言語 | Python 3.12（uv 管理） | ## 統合パターン oniwaban は **OpenAI 互換 HTTP API** を contract として持つため、特定のシステムに依存しない。想定される統合パターン： | 利用シーン | 統合コスト | |---|---| | Discord ベース multi-agent システム | adapter 1ファイル（既存の Provider 切替機構に乗る） | | IDE 拡張（Continue.dev / Cursor 等） | 設定欄に base URL 入れるだけ | | OSS CLI（aider / cline / open-interpreter 等） | `OPENAI_API_BASE` 環境変数のみ | | GitHub Actions 自動化 | curl で叩くだけ | | 任意の OpenAI SDK 利用コード | base URL 1行変更 | 詳細な統合手順は [integration-patterns.md](docs/architecture/integration-patterns.md) を参照。 ## 学習用 Wiki AI 開発の前提知識から oniwaban の設計思想まで、**高校生でも読める語り口** で解説した学習用 Wiki を別途用意： 📚 **[Wiki トップ →](https://github.com/oniwaban-dev/oniwaban/wiki)** カテゴリ：基礎（Transformer / 量子化 / MoE）、学習手法（LoRA / 蒸留 / マージ / abliteration）、ツール（ollama / vLLM / axolotl / mergekit）、設計思想、運用インフラ、会話メモ — 全 35 記事。 ## 設計ドキュメント | ドキュメント | 内容 | |---|---| | [overview.md](docs/architecture/overview.md) | 全体設計とロードマップ | | [model-build-pipeline.md](docs/architecture/model-build-pipeline.md) | base 差替可能な model build pipeline 仕様 | | [role-abstraction.md](docs/architecture/role-abstraction.md) | Role 抽象と reference roles | | [integration-patterns.md](docs/architecture/integration-patterns.md) | 外部システムからの統合パターン | ## 開発フロー # 環境構築 just sync # 品質チェック just lint just typecheck just test # 全部まとめて just check ## ライセンス [Apache-2.0](LICENSE) 派生モデルは base model のライセンスに従う（各モデルのリリース時に MODEL_CARD.md で個別記載予定）。 ## 関連 - [shikomi](https://github.com/shikomi-dev/shikomi) — Rust 製プロジェクト（Rust LoRA の検証対象）

标签：Abliteration, AI编程助手, Black Hat, DevSecOps, LLM, LoRA, mergekit, MLOps, Multi-Agent, Multi-LoRA, Offensive Security, Pipeline as Code, Qwen-Coder, Sakana AI, Unmanaged PE, 上游代理, 个人AI, 人工智能, 代码审查, 代码生成, 多Agent系统, 多语言编程, 大型语言模型, 安全审查, 开源框架, 开源模型, 持续集成, 本地大模型, 本地部署, 模型优化, 模型合并, 模型定制, 模型微调, 渗透测试工具, 用户模式Hook绕过, 网络安全, 自动化流水线, 角色特化, 软件开发, 逆向工具, 隐私保护