使用 RAG 的 LLM 需要訪問高質量的訓練數(shù)據。然而,由于數(shù)據分散在不同部門、系統(tǒng)和格式中,確保數(shù)據的質量和可用性往往具有挑戰(zhàn)性。
為了最大限度地發(fā)揮效果,使用 RAG 的 LLM 還需要連接到部門希望提取數(shù)據的來源 - 如客戶服務平臺、內容管理系統(tǒng)和人力資源系統(tǒng)等。這類集成需要豐富的技術專業(yè)知識,包括數(shù)據映射和 API 管理經驗。
此外,當 RAG 模型大規(guī)模部署時,會消耗大量計算資源并產生大量數(shù)據。這需要適當?shù)幕A設施和部署經驗,以及管理大型組織數(shù)據的能力。
RAGOps 是一種引起 AI 專家關注的主流化 RAG 方法,它是一種能夠以確保一致性同時降低復雜性的方式自動化 RAG 工作流、模型和接口的方法。
RAGOps 使數(shù)據科學家和工程師能夠自動化數(shù)據攝取和模型訓練以及推理。它還通過提供基礎設施堆棧中的負載均衡和分布式計算機制來解決可擴展性難題。在 RAG 管道的每個階段都執(zhí)行監(jiān)控和分析,以幫助持續(xù)改進模型和運營。
例如,麥肯錫使用 RAGOps 幫助其 Lilli 生成式 AI 平臺篩選 10 萬份精選文檔。Lilli 已經回答了超過 800 萬個由約四分之三的麥肯錫員工提出的關于運營洞察的問題。
智能代理 RAG 的時代即將到來
作為組織尋求從生成式 AI 實施中獲取更多價值的運營模式,RAGOps 有望在已經實踐過其他運營框架 (如 DevOps 或 MLOps) 的組織中得到良好應用。
然而,一些組織可能會采取更新穎的方法,即順應生成式 AI 行業(yè)的發(fā)展方向:將 RAG 與智能代理 AI 結合,使 LLM 能夠適應不斷變化的環(huán)境和業(yè)務需求。
設計用于以最少人工干預執(zhí)行數(shù)字任務的代理正引起尋求將更多數(shù)字操作委托給軟件的企業(yè)的興趣。根據德勤研究,到 2025 年將有 25% 的組織實施企業(yè)代理,到 2027 年將增長到 50%。
具有 RAG 的智能代理 AI 將包括多種方法和解決方案,但許多場景可能會共享一些共同特征。
例如,單個代理將評估和總結來自單個文檔的問題答案,甚至比較多個文檔之間的答案。元代理將協(xié)調這個過程,管理單個代理并整合輸出以提供連貫的響應。
最終,代理將在 RAG 框架內工作,進行多步分析、規(guī)劃和推理,在執(zhí)行任務時學習并根據新輸入調整其策略。這將幫助 LLM 隨著時間的推移更好地響應更細微的提示。
至少在理論上是這樣。
總結
生成式 AI 技術的未來一片光明,它將從研究實驗室流向企業(yè) AI 工廠,成為蓬勃發(fā)展的企業(yè) AI 領域的一部分。
例如,模型的占用空間將縮小,同時變得更加優(yōu)化,能夠在本地和邊緣的 AI PC 等設備上高效運行。RAG 標準化,包括軟件庫和現(xiàn)成工具,將繼續(xù)增長。
無論您的組織是采用 RAGOps 還是采用智能代理 AI,都正在出現(xiàn)解決方案來幫助組織擴展 RAG 實施。
例如,當應用于醫(yī)療保健時,基于 NVIDIA 的 Dell AI Factory 的智能代理 RAG 有助于協(xié)調使用結構化數(shù)據 (如患者日程和檔案) 和非結構化數(shù)據 (如醫(yī)療記錄和影像文件) 的挑戰(zhàn),同時保持對 HIPAA 等要求的合規(guī)性。
這只是一個光明的選擇。更多解決方案正在涌現(xiàn),為正在進行生成式 AI 之旅的組織指明方向。
了解更多關于基于 NVIDIA 的 Dell AI Factory 的信息。
由戴爾科技集團為您呈現(xiàn)。