
幾乎每家 AI 廠商現在都在賣「文件的語意搜尋」——也就是用向量 embedding 的 RAG。實用,但有天花板,而且天花板剛好在一個真實問題跨三份文件的瞬間。
本文對同一份語料拿兩種查詢做對比:一個是相似度查找,另一個是多跳推理(「我們已經 rollback 過的金流整合是哪些,後來換成什麼?」)。第一種純向量就夠。第二種需要帶類型的關係——uses、depends、supersedes、contradicts——這些是圖譜原生編碼的東西。
我們展示實際採用的 schema、為什麼選五種邊類型而不是五十種、以及圖譜與向量庫如何並存而不是互相競爭。