cognis-digital/cognis-sources
GitHub: cognis-digital/cognis-sources
收录一万多条跨领域公开技术与研究链接的结构化精选索引数据集,提供隐私过滤后的机器可读JSON格式以便程序化查询和摄取。
Stars: 0 | Forks: 0
# Cognis 源
跨越 **5,133 个域名**的 **10,338 个链接**(来自 223 个 HTML 文档 + 书签)。
## 使用说明 — 分步指南
这是一个精选的链接数据集(不提供 CLI)—— 索引位于 `README.md` 中,完整的机器可读数据位于 [`sources.json`](sources.json) 中。
1. **获取数据:**
git clone https://github.com/cognis-digital/cognis-sources && cd cognis-sources
2. 在本 README 中**按类别浏览**(安全与 OSINT、政府与标准、研究与学术界等),每个类别均按域名分组并附带链接数。
3. 从 `sources.json` 中以编程方式**查询完整索引** —— 每个链接均按域名分组:
jq '.[] | select(.domain=="arxiv.org")' sources.json
4. **针对你的用例进行过滤** —— 例如,将每个 `.gov` 标准域名提取到订阅列表中:
jq -r 'keys[] | select(endswith(".gov"))' sources.json
5. **将其提供给 agent / CI** —— 加载 `sources.json` 作为爬虫、RAG 摄取或 OSINT pipeline 的种子列表。严格的隐私过滤器已排除了邮件/银行/社交/健康/私人主机,因此可以安全地进行全量摄取。
## 安全与 OSINT(42 个域名)
- **www.bellingcat.com** — 6 个链接
- **attack.mitre.org** — 5 个链接
- **owasp.org** — 5 个链接
- **www.cisecurity.org** — 4 个链接
- **entersoftsecurity.com** — 3 个链接
- **aida.mitre.org** — 2 个链接
- **www.mitre.org** — 2 个链接
- **anysecurity.Co** — 1 个链接
- **atlas.mitre.org** — 1 个链接
- **berlin-security-conference.com** — 1 个链接
- **blog.entersoftsecurity.com** — 1 个链接
- **caldera.mitre.org** — 1 个链接
- **cheatsheetseries.owasp.org** — 1 个链接
- **ctid.mitre-engenuity.org** — 1 个链接
- **cve.mitre.org** — 1 个链接
- **d3fend.mitre.org** — 1 个链接
- **darqsecurity.ai** — 1 个链接
- **elearnsecurity.com** — 1 个链接
- **emb3d.mitre.org** — 1 个链接
- **engage.mitre.org** — 1 个链接
- **genai.owasp.org** — 1 个链接
- **kivusecurity.org** — 1 个链接
- **krebsonsecurity.com** — 1 个链接
- **mitre-attack.github.io** — 1 个链接
- **opensecuritytraining.info** — 1 个链接
- **packetstormsecurity.com** — 1 个链接
- **securityconference.org** — 1 个链接
- **securitylab.amnesty.org** — 1 个链接
- **securitytraders.org** — 1 个链接
- **securitytrails.com** — 1 个链接
- **securityvisionmb.alarmbiller.com** — 1 个链接
- **trufflesecurity.com** — 1 个链接
- **www.adamosecurity.com** — 1 个链接
- **www.aspensecurityforum.org** — 1 个链接
- **www.centerforhealthsecurity.org** — 1 个链接
- **www.cybersecuritycoalition.org** — 1 个链接
- **www.justsecurity.org** — 1 个链接
- **www.picussecurity.com** — 1 个链接
- **www.sans.org** — 1 个链接
- **www.securitybsides.com** — 1 个链接
- **www.securityweek.com** — 1 个链接
- **www.welivesecurity.com** — 1 个链接
## 代码与仓库(3 个域名)
- **github.com** — 422 个链接
- **gist.github.com** — 5 个链接
- **gitlab.com** — 1 个链接
## 政府与标准(440 个域名)
- **www.justice.gov** — 36 个链接
- **www.cisa.gov** — 33 个链接
- **www.energy.gov** — 32 个链接
- **csrc.nist.gov** — 25 个链接
- **crsreports.congress.gov** — 24 个链接
- **www.sec.gov** — 20 个链接
- **sam.gov** — 19 个链接
- **www.dhs.gov** — 18 个链接
- **www.dni.gov** — 16 个链接
- **www.acquisition.gov** — 15 个链接
- **www.federalreserve.gov** — 14 个链接
- **www.cia.gov** — 13 个链接
- **www.fbi.gov** — 13 个链接
- **www.fema.gov** — 13 个链接
- **www.gsa.gov** — 13 个链接
- **www.sba.gov** — 13 个链接
- **www.eia.gov** — 12 个链接
- **www.state.gov** — 12 个链接
- **casagrandeaz.gov** — 11 个链接
- **media.defense.gov** — 11 个链接
- **www.congress.gov** — 11 个链接
- **www.whitehouse.gov** — 10 个链接
- **dodcio.defense.gov** — 9 个链接
- **www.archives.gov** — 9 个链接
- **www.gov.uk** — 9 个链接
- **www.nsa.gov** — 9 个链接
- **www.defense.gov** — 8 个链接
- **www.usgs.gov** — 8 个链接
- **home.treasury.gov** — 7 个链接
- **www.bls.gov** — 7 个链接
- **www.nasa.gov** — 7 个链接
- **www.nist.gov** — 7 个链接
- **www.war.gov** — 7 个链接
- **business.defense.gov** — 6 个链接
- **www.federalregister.gov** — 6 个链接
- **www.pinal.gov** — 6 个链接
- **nces.ed.gov** — 5 个链接
- **ofac.treasury.gov** — 5 个链接
- **www.dol.gov** — 5 个链接
- **www.va.gov** — 5 个链接
- **aspr.hhs.gov** — 4 个链接
- **www.dea.gov** — 4 个链接
- **www.fai.gov** — 4 个链接
- **www.usaspending.gov** — 4 个链接
- **www.usda.gov** — 4 个链接
- **acquisitiongateway.gov** — 3 个链接
- **science.nasa.gov** — 3 个链接
- **science.osti.gov** — 3 个链接
- **vsc.gsa.gov** — 3 个链接
- **www.bea.gov** — 3 个链接
- **www.fincen.gov** — 3 个链接
- **www.iarpa.gov** — 3 个链接
- **www.ncbi.nlm.nih.gov** — 3 个链接
- **www.nps.gov** — 3 个链接
- **www.nrel.gov** — 3 个链接
- **www.nro.gov** — 3 个链接
- **www.pnnl.gov** — 3 个链接
- **www.sbir.gov** — 3 个链接
- **www.usa.gov** — 3 个链接
- **www.usajobs.gov** — 3 个链接
## 研究与学术界(153 个域名)
- **arxiv.org** — 82 个链接
- **ocw.mit.edu** — 25 个链接
- **www.brookings.edu** — 6 个链接
- **tutorial.math.lamar.edu** — 5 个链接
- **www.airuniversity.af.edu** — 5 个链接
- **aaf.dau.edu** — 4 个链接
- **haarp.gi.alaska.edu** — 4 个链接
- **www.feynmanlectures.caltech.edu** — 4 个链接
- **crypto.stanford.edu** — 3 个链接
- **cyber.fsi.stanford.edu** — 3 个链接
- **hyperphysics.phy-astr.gsu.edu** — 3 个链接
- **nsarchive.gwu.edu** — 3 个链接
- **www.cdse.edu** — 3 个链接
- **www.dau.edu** — 3 个链接
- **aiindex.stanford.edu** — 2 个链接
- **ci.coastal.edu** — 2 个链接
- **cset.georgetown.edu** — 2 个链接
- **dl.acm.org** — 2 个链接
- **ieeexplore.ieee.org** — 2 个链接
- **jsou.edu** — 2 个链接
- **mfe.baruch.cuny.edu** — 2 个链接
- **moodle.coastal.edu** — 2 个链接
- **ndupress.ndu.edu** — 2 个链接
- **people.csail.mit.edu** — 2 个链接
- **usnwc.edu** — 2 个链接
- **ww2.coastal.edu** — 2 个链接
- **www.sei.cmu.edu** — 2 个链接
- **www.ssrn.com** — 2 个链接
- **afrotc.yalecollege.yale.edu** — 1 个链接
- **ai.stanford.edu** — 1 个链接
- **annals.math.princeton.edu** — 1 个链接
- **arxiv-sanity-lite.com** — 1 个链接
- **bair.berkeley.edu** — 1 个链接
- **berkleycenter.georgetown.edu** — 1 个链接
- **cacm.acm.org** — 1 个链接
- **ccrma.stanford.edu** — 1 个链接
- **chuck.cs.princeton.edu** — 1 个链接
- **citap.unc.edu** — 1 个链接
- **cor.stanford.edu** — 1 个链接
- **crfm.stanford.edu** — 1 个链接
- **cs50.harvard.edu** — 1 个链接
- **cse.ucsd.edu** — 1 个链接
- **csetechrep.ucsd.edu** — 1 个链接
- **css.georgetown.edu** — 1 个链接
- **ctc.westpoint.edu** — 1 个链接
- **defense.arizona.edu** — 1 个链接
- **digital-commons.usnwc.edu** — 1 个链接
- **dragonfly.jhuapl.edu** — 1 个链接
- **droughtmonitor.unl.edu** — 1 个链接
- **dss.princeton.edu** — 1 个链接
- **eartharxiv.org** — 1 个链接
- **ee.stanford.edu** — 1 个链接
- **eisenhower.ndu.edu** — 1 个链接
- **engineering.wisc.edu** — 1 个链接
- **ethicsunwrapped.utexas.edu** — 1 个链接
- **faculty.evansville.edu** — 1 个链接
- **fcic-static.law.stanford.edu** — 1 个链接
- **finance.wharton.upenn.edu** — 1 个链接
- **genome.ucsc.edu** — 1 个链接
- **hai.stanford.edu** — 1 个链接
## 文档(34 个域名)
- **docs.google.com** — 17 个链接
- **developer.algorand.org** — 9 个链接
- **developer.mozilla.org** — 2 个链接
- **developer.nvidia.com** — 2 个链接
- **docs.aurorasolar.com** — 2 个链接
- **docs.litellm.ai** — 2 个链接
- **docs.nvidia.com** — 2 个链接
- **docs.openwebui.com** — 2 个链接
- **developer.apple.com** — 1 个链接
- **developer.purestake.io** — 1 个链接
- **docs.alpaca.markets** — 1 个链接
- **docs.claude.com** — 1 个链接
- **docs.cline.bot** — 1 个链接
- **docs.cosmos.network** — 1 个链接
- **docs.cryptomator.org** — 1 个链接
- **docs.developer.yelp.com** — 1 个链接
- **docs.flashbots.net** — 1 个链接
- **docs.literalai.com** — 1 个链接
- **docs.metaplex.com** — 1 个链接
- **.mistral.ai** — 1 个链接
- **docs.polymarket.com** — 1 个链接
- **docs.ray.io** — 1 个链接
- **docs.raydium.io** — 1 个链接
- **docs.sbossu.com** — 1 个链接
- **docs.social.network** — 1 个链接
- **docs.solana.com** — 1 个链接
- **docs.trychroma.com** — 1 个链接
- **docs.velociraptor.app** — 1 个链接
- **docs.vllm.ai** — 1 个链接
- **docs.web3j.io** — 1 个链接
- **py-algorand-sdk.readthedocs.io** — 1 个链接
- **pycryptodome.readthedocs.io** — 1 个链接
- **www.nextdocs.io** — 1 个链接
- **www.w3docs.com** — 1 个链接
## 云与基础设施(13 个域名)
- **cloud.google.com** — 4 个链接
- **aws.amazon.com** — 3 个链接
- **azure.microsoft.com** — 2 个链接
- **registry.opendata.aws** — 2 个链接
- **aws.state.ak.us** — 1 个链接
- **azureforeducation.microsoft.com** — 1 个链接
- **console.aws.amazon.com** — 1 个链接
- **english.aawsat.com** — 1 个链接
- **lamport.azurewebsites.net** — 1 个链接
- **lionclaws.com** — 1 个链接
- **signin.aws.amazon.com** — 1 个链接
- **www.docker.com** — 1 个链接
- **www.lawsociety.org.nz** — 1 个链接
## 文章与媒体(36 个域名)
- **www.youtube.com** — 96 个链接
- **medium.com** — 15 个链接
- **navnoorbawa.substack.com** — 3 个链接
- **blog.google** — 2 个链接
- **aletteraday.substack.com** — 1 个链接
- **altgoesmainstream.substack.com** — 1 个链接
- **andrewsullivan.substack.com** — 1 个链接
- **blog.amberdata.io** — 1 个链接
- **blog.cloudflare.com** — 1 个链接
- **blog.feedspot.com** — 1 个链接
- **blog.holochain.org** — 1 个链接
- **blog.mythx.io** — 1 个链接
- **blog.research.google** — 1 个链接
- **blog.sekoia.io** — 1 个链接
- **blog.technitium.com** — 1 个链接
- **blog.us.playstation.com** — 1 个链接
- **derivvaluation.medium.com** — 1 个链接
- **elblogbruno.github.io** — 1 个链接
- **fs.blog** — 1 个链接
- **goghieas.substack.com** — 1 个链接
- **googleprojectzero.blogspot.com** — 1 个链接
- **greenwald.substack.com** — 1 个链接
- **hedgevision.substack.com** — 1 个链接
- **jessesingal.substack.com** — 1 个链接
- **mate.substack.com** — 1 个链接
- **music.youtube.com** — 1 个链接
- **public.substack.com** — 1 个链接
- **pumpparade.medium.com** — 1 个链接
- **rupakghose.substack.com** — 1 个链接
- **seymourhersh.substack.com** — 1 个链接
- **solana.blog** — 1 个链接
- **tspasemiconductor.substack.com** — 1 个链接
- **vickyward.substack.com** — 1 个链接
- **www.positivityblog.com** — 1 个链接
- **youtubechanneltranscripts.com** — 1 个链接
- **youtubetotranscript.com** — 1 个链接
## 其他(4412 个域名)
- **online.fliphtml5.com** — 853 个链接
- **en.wikipedia.org** — 704 个链接
- **www.google.com** — 165 个链接
- **www.genspark.ai** — 94 个链接
- **13f.info** — 80 个链接
- **whalewisdom.com** — 56 个链接
- **www.linkedin.com** — 43 个链接
- **www.reuters.com** — 38 个链接
- **huggingface.co** — 35 个链接
- **stockzoa.com** — 34 个链接
- **www.darpa.mil** — 29 个链接
- **www.nature.com** — 25 个链接
- **finance.yahoo.com** — 22 个链接
- **www.reddit.com** — 22 个链接
- **www.semanticscholar.org** — 22 个链接
- **www.csis.org** — 21 个链接
- **www.rand.org** — 21 个链接
- **www.bloomberg.com** — 20 个链接
- **www.greatdreams.com** — 19 个链接
- **home.army.mil** — 18 个链接
- **static.cfr.org** — 18 个链接
- **www.jcs.mil** — 18 个链接
- **www.amazon.com** — 17 个链接
- **hedgefollow.com** — 16 个链接
- **www.army.mil** — 15 个链接
- **www.nato.int** — 15 个链接
- **www.atlanticcouncil.org** — 14 个链接
- **www.vatican.va** — 14 个链接
- **www.ssga.com** — 13 个链接
- **www.cnbc.com** — 12 个链接
- **www.dla.mil** — 12 个链接
- **www.ft.com** — 11 个链接
- **www.khanacademy.org** — 11 个链接
- **www.microsoft.com** — 11 个链接
- **www.sciencedirect.com** — 11 个链接
- **acleddata.com** — 10 个链接
- **openai.com** — 10 个链接
- **rapidapi.com** — 10 个链接
- **seekingalpha.com** — 10 个链接
- **twitter.com** — 10 个链接
- **www.iacr.org** — 10 个链接
- **eprint.iacr.org** — 9 个链接
- **www.dcsa.mil** — 9 个链接
- **www.nvidia.com** — 9 个链接
- **www.nytimes.com** — 9 个链接
- **www.spoc.spaceforce.mil** — 9 个链接
- **www.imf.org** — 8 个链接
- **www.investopedia.com** — 8 个链接
- **www.secnav.navy.mil** — 8 个链接
- **www.understandingwar.org** — 8 个链接
- **archive.org** — 7 个链接
- **disboard.org** — 7 个链接
- **research.darqlabs.io** — 7 个链接
- **solana.com** — 7 个链接
- **www.afrl.af.mil** — 7 个链接
- **www.criticalthreats.org** — 7 个链接
- **www.defensenews.com** — 7 个链接
- **www.diu.mil** — 7 个链接
- **www.geeksforgeeks.org** — 7 个链接
- **www.gutenberg.org** — 7 个链接
## 完整索引
请参阅 [`sources.json`](sources.json) 获取按域名分组的完整链接。
## 如何契合
```
flowchart LR
U[You / CI / Agent] --> R[cognis-sources]
R --> O[Outputs & artifacts]
R --> M[MCP / JSON]
M --> AI[AI agents]
R --> S[Cognis Neural Suite]
```
**探索完整套件 →** [🗂️ 所有工具](https://github.com/cognis-digital/cognis-neural-suite) · [⭐ awesome-cognis](https://github.com/cognis-digital/awesome-cognis) · [🔗 cognis-sources](https://github.com/cognis-digital/cognis-sources)
## 互操作性
`cognis-sources` 可与包含 300 多个工具的 Cognis 套件组合使用 —— JSON 输入/输出以及共享的
OpenAI 兼容 `/v1` 主干。请参阅 **[INTEROP.md](INTEROP.md)** 了解
套件图谱、组合模式和参考技术栈。
## 集成
通过 [`cognis-connect`](https://github.com/cognis-digital/cognis-connect) 将 `cognis-sources` 的发现结果转发到 STIX/MISP/Sigma/Splunk/Elastic/Slack/webhooks。请参阅 **[INTEGRATIONS.md](INTEGRATIONS.md)**。
标签:ESC4, Homebrew安装, OSINT, RAG, 开源目录, 网络安全研究, 链接集合, 防御加固