2025-05-22

閱讀 : 分鐘

0  則留言

傳統 RAG 技術致命缺陷曝光!5 分鐘升級讓準確率飆升 96.3%|Anthropic 最新技術不寫程式改造 AI 第二大腦|n8n教學

By 追日Gucci

2025-05-22

AI第二大腦, RAG技術

☕️我的文章對你有所幫助嗎?那麼考慮請我喝杯咖啡吧!☕️

Loading

你是否曾經在使用 RAG(Retrieval-Augmented Generation)技術打造 AI 知識庫或第二大腦時,遇到關鍵時刻答案不準確、資料斷章取義的尷尬情況?我自己過去也深受這個問題困擾,尤其是當我需要在老闆或同事面前展示資料時,AI 卻給出錯誤資訊,讓我倍感挫折。幸運的是,Anthropic 最近釋出了革命性的 Contextual Embeddings 技術,讓我只花了短短 5 分鐘,透過 n8n 教學流程改造,不寫程式就能讓錯誤率降低 35%,準確率飆升到 96.3%,這個成果讓我迫不及待想和大家分享!同時,我也會談談 OpenAI Image API 在內容創作中的應用,幫助你全面提升工作效率與創作品質。

介紹RAG技術與提升準確率的重點

Indice

🔍 RAG 技術的核心問題與上下文重要性

傳統的 RAG 技術運作方式是將大量的文件切割成一個個小片段(chunk),然後將這些片段向量化並存入向量資料庫中。這種方法雖然方便,但卻有一個致命缺陷:每個 chunk 只看得到自己片段的資訊,缺乏整體文件的上下文。舉例來說,當我問 AI「NVIDIA 2023 年第二季的營收是多少?」時,它可能只找到一個片段,但該片段不一定包含 2023 年第二季的資料,甚至可能是其他公司或季度的資訊,導致答案錯誤。

這種斷章取義的狀況,正是因為資料碎片缺乏上下文所致。文件被拆成許多獨立的小片段,AI 在搜尋時只能根據這些孤立的片段做出判斷,容易「牛頭不對馬嘴」。這也是為什麼許多使用者會在關鍵時刻遭遇錯誤回答的根本原因。

傳統RAG資料切割與缺乏上下文問題示意

⚙️ Anthropic 最新 Contextual Embeddings 技術解析與實作

為了解決傳統 RAG 的缺陷,Anthropic 推出了 Contextual Embeddings 技術,這是我這次改造 n8n 工作流的核心。它的原理是在把資料切割成 chunk 之前,先讓 AI 讀取整份文件的「全文上下文」,並且在為每個 chunk 生成向量時,同時加入這個上下文資訊。這樣一來,每個 chunk 不再是孤立的,而是帶有豐富的全局脈絡,讓 AI 在檢索時能更準確地匹配問題與答案。

Anthropic 這篇教學文件非常詳盡,強調在資料向量化之前先塞入「Whole Document」資訊,讓模型能參考整篇文件的內容,然後為每個小片段 chunk 加上一個有意義且簡短的上下文標籤。這個過程大幅降低了搜尋錯誤率,實測數據顯示錯誤率下降了約 35%,而且準確率提升至 96.3%。

此外,Anthropic 也提到了另一種排序演算法 BM25,雖然能進一步降低錯誤率至 49%,但需要寫程式實作,對一般使用者來說門檻較高。這次我分享的 Contextual Embeddings 方法則完全不需要寫程式,透過 n8n 自動化平台就能輕鬆完成。

Contextual Embeddings 技術示意與資料流程

🛠️ n8n 教學:5 分鐘打造強化版 RAG 工作流

實際上,我是如何在 n8n 平台中實作這個 Contextual Embeddings 技術的呢?整體流程分為以下幾個步驟:

  1. 將整份文件讀入,讓模型先「看過」全文內容。
  2. 將文件切割成約 500 字元的多個 chunk。
  3. 針對每個 chunk,將全文上下文與 chunk 內容一起送入大語言模型,生成該 chunk 的上下文描述。
  4. 將帶有上下文的 chunk 透過 Embedding Model 向量化,並寫入向量資料庫(如 Supabase)。
  5. 查詢時從向量資料庫取得帶上下文的結果,提升回答的準確度。

這裡特別要提到,我使用了 OpenAI 最新的 GPT 4.1 Nano 模型來生成上下文。這個模型不僅價格極其便宜(每百萬 token 僅約 1 美元以下),而且反應速度快,非常適合進行大量 chunk 的上下文生成。舉例來說,我處理一份 60 頁的 NVIDIA 季報 PDF,大約會切成 400 多個 chunk,整個上下文生成過程花費約 10-20 分鐘,成本卻非常低。

n8n 工作流中加入全文上下文生成步驟

在 n8n 的設置中,我利用 data loader 將上下文與 chunk 內容以三個破折號區分,並將檔案 ID、標題及 URL 一併寫入向量資料庫的 metadata,這些細節對於提升 RAG 查詢的準確性非常關鍵。特別是檔名與檔案目的的清楚標示,也會大幅幫助後續查詢。

💡 實測案例:從 NVIDIA 財報到 YouTube 影片內容查詢

為了驗證這套強化版 RAG 的效果,我做了多項測試。首先是 NVIDIA 2025 年第三季財報的查詢,我問系統該季的利潤率,結果不僅有毛利率、營業利潤率、淨利率的完整數據,且資料都精確無誤。這得益於每個 chunk 都附帶完整上下文,使得系統能快速抓取正確的片段。

查詢NVIDIA財報利潤率結果

其次,我詢問公司未來重大計畫,系統回應了 NVIDIA 新型主機架構、供應鏈合作與技術發展焦點等內容,完全符合財報中公開訊息。這種精準度在面對長達 60 頁的文件時尤為重要,讓我能快速找到重點。

除了財報,我還將多部自己 YouTube 影片的逐字稿丟入 RAG 知識庫,並測試查詢影片中使用的技術。例如我問「在這部影片中,我用到了哪些技術來達成?」系統回答了關鍵字碼、n8n、AirTable 及 AirTable Automation,還提及 Flux、Kling PiAPI 生成圖片與影片,甚至 FFMPEG 技術合併影片,連音樂生成也解釋得非常清楚,完全正確無誤,讓我對這套系統充滿信心。

查詢YouTube影片技術細節示意

另外,我也詢問了利用 OpenAI 最新 Image Generation API 生成適合 Marketing 及產品設計的技術細節,系統同樣給出全面且詳盡的回答,這對於創作者運用 AI 進行內容創作提供了極大幫助。

🚀 RAG 作為你的 AI 第二大腦:創作者與上班族的必備利器

不管你是內容創作者還是一般上班族,RAG 技術都能成為你的第二大腦。對創作者來說,你的 Podcast、YouTube 影片、Blog 文章、社群貼文等所有創作內容,都能集中管理在 RAG 知識庫中,方便隨時查詢與二次創作。

對於上班族,會議紀錄(文字、聲音、影片)、閱讀筆記、學習筆記,以及追蹤的 KOL 文章,都可以統一存入向量資料庫。這讓我在工作中能隨時快速檢索重要資訊,避免遺漏細節,提升工作效率。

更棒的是,這套系統不只是查詢工具,還能幫助你生成文章、覆盤學習狀況、整理會議紀錄,甚至挖掘第二大腦中的重要洞見。透過我親自示範的案例,例如請 AI 根據我的影片產出社群媒體文章,或是替另一位 YouTuber 的 AI 自動化專訪撰寫擴散文案,產出的內容都非常精準且符合原始資料,這是因為 AI 是從你的知識庫中擷取資訊,而非直接從大語言模型隨機生成,品質和準確度大幅提升。

AI根據RAG知識庫生成文章示意

總結:用 n8n 教學與 OpenAI Image API 打造高效、準確的 AI 第二大腦

透過這次的分享,我相信你已經深刻理解為什麼傳統 RAG 技術會在關鍵時刻出錯,以及如何利用 Anthropic 最新的 Contextual Embeddings 技術,在不寫程式的情況下,透過 n8n 教學快速改造你的系統,將錯誤率降低近 40%,準確率提升至 96.3%。

這不僅是技術上的突破,更是實用性的大幅提升。無論你是創作者還是上班族,擁有一個精準可靠的 AI 第二大腦,都能讓你更有效率地管理知識、創作內容,甚至進行深入洞察。

另外,結合 OpenAI Image API 等最新工具,更能幫助你在行銷、產品設計等領域創造出色的視覺內容,讓工作與創作更上一層樓。

如果你想學習如何快速打造這套強化版 RAG 系統,歡迎加入我的 AI Skool 社群,這裡提供完整的 n8n 教學、模板下載與持續更新的 AI 實戰課程,還有專業技術支援,陪伴你一起走在 AI 時代的最前端。

別忘了,掌握這些技術,讓你的工作效率與內容創作能力提升 10 倍,成為真正的 AI 效率革命者!

加入AI效率革命聯盟

槓桿 AI 成為最強助手,自動化每個流程,落實「Work Less, Make More」。


馬上加入

馬上看影片教學:傳統 RAG 技術致命缺陷曝光!5 分鐘升級讓準確率飆升 96.3%|Anthropic 最新技術不寫程式改造 AI 第二大腦

關於作者

我投資美股,主要方式為超長期價值投資持有股息成長型企業,
並搭配簡易選擇權以合理價之下的價格購入,且將股票出租,每月創造現金流,讓等待的時間也能額外創造被動收入並加速雪球效應產生的速度。
現金流就像我種樹, 只吃果實,也只取我夠吃的果實,而樹枝仍會持續茁壯。

延伸閱讀:

發佈留言

Your email address will not be published. Required fields are marked

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}