Internal Workbench
这个首版工作台以当前会议研究成果为起点,把样本级结构化成果升级成可检索、可审计、可持续同步的内部系统。 当前页面展示的是项目链路基线数据、覆盖审计样本和候选扩展方向,工作台正在从样本浏览升级成“页面 + 附件 + PDF + 证据块”的全链路入库台面。
已同步进 `crawl_source` 的官方来源会在独立页面展开展示,不再只停留在首页数量。平台主页、检索入口、允许域名和抓取适配方式会一起摊开。
目录覆盖全国公共资源平台、央企电商平台、核电平台、铁路平台、钢铁冶金平台和发现补漏层。
首屏直接展示哪些来源更适合做公告发现,哪些来源更值得继续补页级 / 附件级抓取。
已经把能源、电力、核电、铁路、石化、钢铁等重点平台并到同一入口,方便继续按行业扩展而不是散落在笔记里。
来源目录负责展示“我们盯哪些官方平台”,Coverage Audit 继续展示“各来源的回填进度和阻断状态”。
把会议音频复核、全网调研、自动出图架构、BOM/成本框架与证据规则收进同一份页面化执行计划,方便内部直接对照推进。
页面覆盖 Summary、Execution Structure、Required Data Interfaces、Workflow、Final Report Structure、Evidence Rules、Test Plan、Assumptions。
真值顺序、说话人边界、厂商研究优先级、案例采信规则和价格置信度都在计划页内集中固定,避免后续口径漂移。
把原有 4 张“询价 + 套餐 + 公式报价”草表,重构成贴近河南矿山、卫华、大方这类桥门式企业真实流程的 8 张业务表、流程图和权威报告。
专题页统一承载工作簿真值、Markdown 真值、流程图、来源附录与下载入口,旧的 `/customer-intake` 路由改为兼容跳转。
页面把商机初询、技术协议冻结、安装告知、监督检验、使用登记、一机一档和售后维保放进同一条主链,并显式补出冶金、防爆、抓斗、电磁、无人值守和港机重载扩展。
把标准桥式起重机从 RFQ、候选方案、审批图、接口图一路推进到部装图、零件图、制造图与归档,放进一个可编辑、可运行、可审查的画布里。
受控画布内预置 20 个固定节点,把 Agent、CAD Worker、Review Gate 和归档摘要放进同一条真实链路。
首版重点是画布编辑、节点配置、运行时间线、产物抽屉和落库痕迹,不把真实 CAD 执行器硬塞进第一天范围。
把多模态 RAG 教程主源、公开 GitHub 补源和起重机图纸场景映射收进统一的教程入库台面。
固定围绕 `BV1DrFhzREUa` 的 23 分 P 系列,展示章节、主题、关键帧和公开补充文档。
重点章节已经对齐图纸小字识别、多模态 PDF 问答、OCR 评估和本地部署流程。
以标准桥式起重机为样例,把图纸页、区域、检索块和 citation 闭环挂到可视化详情页和 API 上。
样例页支持查看 title block、尺寸链、说明栏和现场确认项等关键区域。
图纸问答 API 会保留 provider_used、model_used、route_mode 和 citations。
所有默认业务请求优先 GPT;sub2 负责主入口,百炼负责兜底,one.hao.work 只用于手动 Qwen 覆盖与 smoke test。
状态页会展示 provider probe、CODA 余额快照、最近调用日志和手动测试入口。
Workflow Gallery 已补齐 Provider 健康检查、GPT-first 路由和 Qwen 手动覆盖测试三条模型工作流。
Coverage 这一层仍然表达回填进度,不等于来源目录本身。官方来源清单已经独立同步展示到 `/sources`,后续 crawler 会按来源、年份、月份持续补齐。
用于表达已完成、部分完成、阻断、空窗口和需要人工补采的状态。
用于表达已完成、部分完成、阻断、空窗口和需要人工补采的状态。
用于表达已完成、部分完成、阻断、空窗口和需要人工补采的状态。
用于表达已完成、部分完成、阻断、空窗口和需要人工补采的状态。
用于表达已完成、部分完成、阻断、空窗口和需要人工补采的状态。
首版已经切到数据库查询,详情页会优先展示项目链路、文档节点、附件和证据块,而不是单公告摘要。
适合提取抓斗起重机工艺链、业绩门槛和试生产边界
适合提取改造场景下的试车、联调和备件策略
适合提取交付、培训、验收及登记资料边界
数据库与 crawler 将把这套工作台从“样本浏览”推进到“全量入库 + 审计闭环 + 方案工厂输入层”。
把公告、澄清、答疑、中标候选人、中标结果、合同公告和附件聚类成项目全链路,并固定回指原始 URL 与 PDF 片段。
引入 crawl、parse、extraction、coverage 表,把 `tender_record` 提升成规范化结果层。
从招投标字段与附件证据反推出 `scheme_requirement` 候选字段和缺失项清单。
定时抓取先入库,再生成审计摘要与统计 manifest,提交到 `sync/data-*` 分支。