数据源与算法说明
说明系统抓取哪些源、如何限流、如何计算震级、如何降级与去重。
当前状态
arxiv
正常 paper · items 0
github
失败 · partial repo · items 24
配置源
| 源 | 类型 | 权重 | 启用 | Base URL |
|---|---|---|---|---|
| arxiv | paper | 0.86 | true | https://export.arxiv.org/api/query |
| github | repo | 0.82 | true | https://api.github.com |
| openalex | paper | 0.72 | false | https://api.openalex.org |
| semantic_scholar | paper | 0.78 | false | https://api.semanticscholar.org |
震级计算
系统使用当前窗口信号、30 天基线、增长率、z_score、跨源确认、机构集中、GitHub star 增量、方法和数据集提及共同计算震级。
M1.0-M2.0 微弱波动;M2.0-M3.0 局部升温;M3.0-M4.0 明显异常;M4.0-M5.0 疑似爆发;M5.0+ 强趋势震荡。
失败与局限
- arXiv 与 GitHub 使用公开 API,配置 API Key 后可提升速率和覆盖。
- Semantic Scholar、OpenAlex 是可选增强源,未配置时不会阻断生产报告。
- 历史不足 30 天时,系统会标记低历史置信度。
- GitHub star 增量只从真实 snapshot 计算,首次运行不会伪造增长。
- 本产品不构成投资、科研选题或技术路线建议。