Files
makemd/docs/ARCHIVE/00_Business/tasks/shared/01_plugin_collection.md
wurenzhi 2b86715c09 refactor: 优化代码结构并修复类型问题
- 移除未使用的TabPane组件
- 修复类型定义和导入方式
- 优化mock数据源的环境变量判断逻辑
- 更新文档结构并归档旧文件
- 添加新的UI组件和Memo组件
- 调整API路径和响应处理
2026-03-23 12:41:35 +08:00

3.4 KiB
Raw Permalink Blame History

平台采集插件任务

任务列表

Task ID 闭环关联 任务描述 输入 输出 触发条件 状态 优先级 依赖 预计耗时 负责人 完成时间
PL-C001 数据采集与清洗闭环 无API平台商品采集引擎 店铺ID, 平台类型, 采集配置, 指纹配置, 代理IP 原始商品数据(JSON) 定时任务/后端指令 completed P0 - 3h AI-Plugin-1 2026-03-20
PL-C002 数据采集与清洗闭环 DOM解析与数据提取 HTML内容, CSS选择器配置 结构化商品数据 采集完成 completed P1 PL-C001 2h AI-Plugin-13 2026-03-20
PL-C003 订单集中管理闭环 无API平台订单采集 店铺ID, 平台账号, 时间范围, 登录状态 订单数据(JSON) 定时任务/后端指令 completed P0 PL-C001 3h AI-Plugin-1 2026-03-20
PL-C004 数据采集与清洗闭环 TikTok Shop商品采集适配器 店铺ID, 采集配置, 指纹配置 商品数据(JSON) 定时任务/后端指令 📝 pending P0 PL-C001 6h AI-Plugin-1 -
PL-C005 数据采集与清洗闭环 Temu商品采集适配器 店铺ID, 采集配置, 指纹配置 商品数据(JSON) 定时任务/后端指令 📝 pending P0 PL-C001 6h AI-Plugin-1 -
PL-C006 订单集中管理闭环 TikTok Shop订单采集适配器 店铺ID, 时间范围, 登录状态 订单数据(JSON) 定时任务/后端指令 📝 pending P0 PL-C003 4h AI-Plugin-1 -
PL-C007 订单集中管理闭环 Temu订单采集适配器 店铺ID, 时间范围, 登录状态 订单数据(JSON) 定时任务/后端指令 📝 pending P0 PL-C003 4h AI-Plugin-1 -
PL-C008 数据采集与清洗闭环 1688商品采集适配器 店铺ID, 采集配置 商品数据(JSON) 定时任务/后端指令 📝 pending P1 PL-C001 5h AI-Plugin-1 -

相关闭环

  • 数据采集与清洗闭环
  • 订单集中管理闭环

依赖关系

PL-C001 ─┬─► PL-C002
          └─► PL-C003

技术约束

  • 必须通过店铺隔离环境执行(独立指纹+代理IP
  • 采集频率受平台反爬限制,需实现自适应频率控制
  • 数据通过HTTP POST上报后端携带traceId和shopId

验收标准

  • 无API平台商品采集引擎能成功采集商品数据
  • DOM解析与数据提取能正确提取结构化数据
  • 无API平台订单采集能成功采集订单数据
  • 所有插件运行稳定,无异常崩溃
  • 数据采集准确率达到95%以上

测试要求

  • 单元测试:覆盖核心采集和解析逻辑
  • 集成测试:验证与后端服务的交互
  • 端到端测试:模拟完整的采集流程
  • 边界测试:测试异常情况和边界数据

性能要求

  • 采集速度能在1小时内采集1000个商品
  • 稳定性连续运行24小时无异常
  • 资源占用CPU使用率不超过50%内存使用不超过1GB

安全要求

  • 数据加密:采集数据传输加密
  • 访问控制基于店铺ID的访问控制
  • 审计日志:所有采集操作需记录详细日志
  • 合规性:遵守目标平台的使用条款