Item Master 遷移計畫

日期:2026-03-19 目的:把目前以發票名稱 ML、PN-barcodechannel_master 為核心的做法,逐步遷移到以 invoice_name_cluster -> SI 為中心的運作模式。 相關文件:

1. 遷移目標

最終目標不是把所有舊條碼資料洗到完全乾淨,而是讓系統穩定產出:

發票名稱群組 -> SI -> BI

遷移完成後:

2. 現況盤點

你目前已經有三條可用資產:

這三條資產都有效,但目前還沒有被擺在同一個決策模型裡。

3. 遷移原則

  1. 不一次性推翻既有能力,先重定位,再逐步退役舊用法。
  2. 先建立新決策層,再處理舊系統切換。
  3. 先做小範圍、可驗證的 MVP,再擴大。
  4. 全程保留證據可追溯性,不做黑盒覆蓋。

4. 分期規劃

階段 0:凍結語彙與決策模型

目標:讓團隊統一用詞,避免再把 barcodePN-barcode 誤叫成唯一身份鍵。

交付物:

完成條件:

階段 1:保留發票名稱 ML,但重新定位

目標:把發票名稱 ML 放回它最擅長的位置。

工作項目:

  1. 建立 merchant-scoped invoice_name_clusters
  2. 讓 ML 輸出品牌、品類與聚類提示。
  3. 以 cluster 取代單筆發票名稱,成為審核與 matching 的最小單位。

完成條件:

階段 2:建立最小 BI / SI

目標:先把高頻商品與高價值品類建出可用的身份層。

工作項目:

  1. 先為高頻商品家族建立 BI
  2. 為單品、組合包、箱購建立 SI
  3. item_components 表示 bundle/carton 由哪些 unit 組成。
  4. 同步發放 BISI 正式代碼。

完成條件:

階段 3:把 PN-barcode 改掛到證據層

目標:保留這條能力,但停止把它當最終 key。

工作項目:

  1. 把既有 PN-barcode 資料匯入 evidence_observations
  2. 為每筆連結補上來源、時間與風險旗標。
  3. 200978/979、placeholder、組合包污染等情況標示出來。

完成條件:

階段 4:把 channel_master 正式降到候選與證據層

目標:讓 channel_master 幫忙候選召回與補證據,但不直接長成 BI / SI

工作項目:

  1. channel_master -> evidence_observations 匯入規則。
  2. 對高風險來源與風險 prefix 加上先驗扣分。
  3. unit / bundle / carton 文案分層,不讓單一 listing 直接覆蓋正式商品。

完成條件:

階段 5:把審核與群眾蒐集改成候選確認流程

目標:把原本自由輸入的任務改成低錯誤率的確認任務。

工作項目:

  1. 審核畫面改成 cluster -> 2~5 個候選 SI
  2. crowd 任務改成「哪個候選最像」。
  3. 只有在沒有合理候選時,才開 new item triage

完成條件:

階段 6:局部切換與驗證

目標:先在核心商家、核心品類做 partial cutover。

工作項目:

  1. 選一批高量商家與高價值品類做雙軌驗證。
  2. 比較舊流程與新流程的命中率、審核效率與錯誤率。
  3. 修正打分規則與審核介面後,再擴大範圍。

完成條件:

5. 舊能力的最終去向

舊能力 是否保留 新位置
發票名稱 ML 保留 聚類、分類、候選生成
PN-barcode 連結 保留 證據層
channel_master 保留 候選池與證據池
crowd 自由輸入 改造後保留 候選確認任務

6. 驗收指標

建議至少追這五個指標:

7. 一句話收尾

遷移的重點不是把舊能力丟掉,而是把它們重新排進同一條決策鏈,讓最終決策固定落在 invoice_name_cluster -> SI