Files
makemd/archive/handover/server-立项.md
wurenzhi 136c2fa579 feat: 初始化项目结构并添加核心功能模块
- 新增文档模板和导航结构
- 实现服务器基础API路由和控制器
- 添加扩展插件配置和前端框架
- 引入多租户和权限管理模块
- 集成日志和数据库配置
- 添加核心业务模型和类型定义
2026-03-17 22:07:19 +08:00

4.6 KiB
Raw Blame History

Crawlful Hub - AI-Native 电商增长中台中枢 (V20.0 立项说明书)

1. 项目愿景与定位 (Vision)

在 AI 与全球化深度融合的背景下Crawlful Hub 旨在构建一个以多模态 AI 为内核、容器化采集为基石、数据驱动决策为导向的电商自动化增长中台。它连接了“全球选品、多维分析、智能创作、自动化分发”的完整闭环,通过 AI 技术实现从“发现利差”到“获取利润”的极速转化。


2. 核心架构与功能模块 (Modules)

2.1 智能大脑 (AI-Native Core)

  • 多模态商品理解 (Multi-Modal AI)
    • 深度解析:集成 GPT-4o 视觉+文本双路解析,自动提取商品核心卖点、技术参数与 SEO 关键词。
    • 智能创作:基于多模态理解,自动生成符合目的地市场文化习惯的营销文案与 SEO 标题。
  • 跨境风控审计 (Security Audit)
    • 图像指纹查重:基于感知哈希 (pHash) 的图像查重引擎,规避搬运风险。
    • 侵权预警 (IP Guard)AI 视觉识别品牌 Logo 与敏感词扫描,降低合规风险。

2.2 采集与溯源 (Crawler & Sourcing)

  • 容器化沙盒采集 (Sandbox Crawler)
    • 物理隔离:基于 Docker 的采集进程池,支持 IP 自动调度与资源配额管理,彻底规避封禁风险。
    • 拟人化模拟:基于 Playwright 实现动态 Canvas/WebGL 指纹随机化与复杂行为轨迹模拟。
  • 供应链全链路溯源 (Link Tracker)
    • 源头寻址:基于图像指纹自动关联 1688 源头厂家,识别多级中间商加价。

2.3 决策支持 (Decision Hub)

  • 全球利差雷达 (Arbitrage Radar)
    • ROI 建模:实时对比 1688、Amazon、Temu 售价,自动计算物流、佣金、税务后的净利润。
  • 库存周转优化 (Inventory Aging)
    • FIFO 库龄分析:基于先入先出逻辑追踪库存库龄,自动触发阶梯清仓折扣建议。

3. 技术架构设计 (V20.0 Stack)

3.1 后端技术栈 (Server)

  • 核心框架Node.js + Express + TypeScript
  • 性能网关Turbo Gateway (基于 Redis 的 L2 缓存与令牌桶限流)
  • AI 引擎OpenAI GPT-4o (Vision + Text)
  • 持久化MySQL 8.0 + Knex.js
  • 异步任务BullMQ + Redis (用于审计日志与大规模采集调度)
  • 容器化Docker (用于 Crawler Sandbox)

3.2 协同机制 (Collaboration)

  • 看板驱动 (Source of Truth):基于 COLLABORATION_BOARD.md 的多 AI 协同开发模式。
  • 契约优先 (Contract-First):通过 shared/types/contracts 定义跨窗口协作协议。

4. 实施路线图 (Roadmap)

第一阶段:基础设施与利差建模 (Completed)

  • 基于 Node.js + TS 的中台架构搭建。
  • 全球价格套利模型与实时汇率同步。
  • 跨平台价格比对 (ArbitrageService)。

第二阶段:业务闭环与安全加固 (Completed)

  • 全球税务合规引擎 (VAT Engine) 与库存周转优化。
  • 基于 pHash 的图像指纹服务与审计系统。
  • Turbo Gateway 性能网关落地。

第三阶段AI-Native 与多模态演进 (Completed)

  • GPT-4o 多模态解析与 SEO 自动化。
  • 基于 Docker 的容器化采集沙盒 (Sandbox Crawler)。
  • AI 侵权预警 (IP Guard) 深度集成。

第四阶段:智能预测与运营自动化 (In Progress)

  • AI 库存预测模型 (Forecaster)。
  • 自动营销挽留系统 (Abandoned Cart Recovery)。
  • 跨平台 API 自动化铺货闭环测试。

5. 项目核心价值 (Value)

  1. AI 替代人力:将繁琐的商品解析与文案改写完全自动化。
  2. 极速套利决策分钟级发现全球利差机会ROI 驱动选品。
  3. 极致稳定性:通过沙盒技术与性能网关,确保单机环境下的高可用性。

6. V22.0 增量补充(平台接入中枢与 Win 节点)

6.1 混合接入策略

  • 已有 APITK Shop API / BC APIConnector Bus
  • 无 API 平台走 No-API Bridge,采用 collect -> draft -> review -> publish
  • 两类链路统一进入 Publish Orchestrator

6.2 多商户与隔离

  • Web 登录为主入口,统一签发租户上下文与短期令牌。
  • 无 API 执行层采用 Win Node Agent一店一上下文隔离。

6.3 执行层模型

  • 推荐结构:Hub(Control Plane) -> Win Node Agent -> Browser Worker
  • 节点主动注册、心跳、拉任务并回传回执,保证前后端持续通讯。

6.4 术语演进

  • 中台前端统一语义:~~Dashboard~~ -> Console