Files
91/91VideoSpider
nianzhibai d424fc0553 feat(spider91): 接入 91porn 爬虫作为新的视频源
把 91VideoSpider/spider_91porn.py 包装成一种 spider91 drive 类型,
每天凌晨自动从 91porn 本月最热第 1 页起翻页,跳过已知 viewkey 凑够
N 个新视频后停止;下载视频和封面到本地,接入现有的视频列表 / 详情
/ 标签 / teaser 流水线。

主要内容:
- Python 脚本:加 --target-new / --seen-viewkeys-file CLI 参数
- 后端:新增 drives/spider91 包(driver + crawler + 测试)
- 后端:catalog.ListVideoFileIDsByDrive 辅助查询
- 后端:crawlerLoop ticker(独立于 02:00-07:00 的网盘扫描循环)
- 后端:HTTP 客户端尊重 HTTPS_PROXY 环境变量 + 每 drive 可选 proxy
- 后端:视频文件后缀按直链 URL 真实后缀决定(mp4/webm/mkv/flv 等)
- 后端:所有 spider91 视频自动打 91porn 标签(source=system)
- API:新增 /p/spider91/{videoID} 路由用 http.ServeFile 服务本地文件
- 管理后台:下拉加 "91 爬虫" 类型;几处特例适配
  (状态显示"已就绪"、操作显示"立即抓取"、扫描根列显示"上次抓取
  N 小时前"、表单隐藏 root_id 等无关字段)
- 文档:README + plan 16 节完整记录

测试:20+ 新增用例覆盖 driver 路径安全、crawler 端到端(伪 python +
httptest 服务器)、扩展名识别、定时窗口判断。
2026-05-22 21:13:26 +08:00
..