• <nav id="5jebs"></nav>
    <button id="5jebs"></button>
        • 技術博客

          技術博客??>??DeepSeek如何落地?這里有一份全面的AI建設規劃指南
          DeepSeek如何落地?這里有一份全面的AI建設規劃指南
          背景圖 2025-02-28 10:30:34

          領跑AI品牌banner

          DeepSeek橫空出世,以低成本、高性能、強開源的三重屬性顛覆大模型產業鏈的傳統邏輯,為我們提出了發展AI技術的另一個解法——并非一味地追求算力膨脹。各行各業都在討論和積極嘗試DeepSeek,用戶對于智能化的認知與實踐正經歷著新一輪的深刻變化,也影響著用戶的AI規劃和落地路徑。

          全面擁抱DeepSeek 建設AI的共識空前一致

          各行業用戶進行AI建設之前,往往要進行大量戰略對齊工作,而在DeepSeek R1火爆之后,用戶建設AI的共識達到空前一致,原本因技術不確定性而存在的觀望態度迅速消解,取而代之的是對AI建設的戰略聚焦。

          資源的重新配置體現為研發預算的傾斜、跨部門協作機制的建立,以及對長期技術投入的容忍度提升。這種自上而下的共識推動AI項目從邊緣試點向核心業務滲透,形成了一種“技術驅動戰略”的新型決策邏輯。

          DeepSeek重塑用戶AI建設路線圖

          一個典型的AI建設整體路線圖,包括8個關鍵步驟,才能實現AI項目的全面落地與持續運營。

          DeepSeek重塑用戶AI建設路線圖

          01 把DeepSeek提升為戰略級目標

          目標應與用戶的戰略緊密相連,確保AI的建設為實現整體戰略目標服務。用戶在建設AI時,經營目標、運營目標和部署目標相互依存,形成一個完整的目標體系。用戶在部署大模型時需要清晰地識別其適用場景與局限,不能一刀切,而應制定合理和差異化的目標。因此,了解何時適合采用AI、何時避免使用AI,以及針對特定場景選擇何種AI技術至關重要。

          DeepSeek大模型的突破性進展,抬高了大模型能力天花板,AI適用場景進一步擴大。它能夠模擬人類專家級的邏輯推演過程,展現出極高的邏輯嚴密性,其核心在于將傳統AI的“規則響應”升級為“認知推演”,這使得AI能夠處理非結構化信息交織的模糊性場景。

          當這種接近人類高階思維的能力注入業務場景,能力的質變直接打破了“AI僅適用于標準化場景”的固有認知,推動應用邊界向戰略規劃、創新設計等高階領域延伸。

          02 評估現狀,了解AI的落地成熟度

          在明確了DeepSeek的戰略目標之后,我們需要了解用戶自身所處的階段,發現薄弱環節,并為下一步的建設方向提供指導。我們主要從4個方面來評估現狀。

          1、戰略與場景

          要確保用戶內部已達成目標的對齊,同時需要優先選擇符合戰略目標,并且具備可行性的場景進行實施。

          2、數據就緒度

          AI項目的成功,一定是數據驅動的。無論是傳統AI還是生成式AI,高質量的數據是AI模型項目的基礎。但對于生成式AI來說,更重要的一點是數據的規模和多樣性。比如DeepSeek R1模型能力強,一方面原因是算法創新,如MLA、強化學習等,更重要是數據質量高、場景覆蓋廣。另外,想要長久保持AI模型的高質量服務,還需要不斷采集數據、反饋數據,對模型進行迭代更新。

          3、AI項目的落地實施,離不開團隊

          需要具備理解業務并轉化為項目的核心架構,以及一些工程化的角色,如數據標注、清洗、模型訓練和調參、工程優化等角色。DeepSeek的優異性能,讓越來越多中小企業可以直接應用,進一步降低了工程化團隊的要求,也會使得AI項目落地更加容易。

          4、資源就緒度

          指的是AI算力,包括計算、存儲、網絡等,以及為了實施項目所需要的一些基礎框架、開發工具等,目的是提供對AI全生命周期的支撐。隨著DeepSeek的規?;瘧?,AI行業重心從訓練轉向推理,未來推理算力的消耗和供給將會極大增加,推理算力占比將從30%提升到70%,用戶在算力選擇方面也會更加便利。

          評估AI的落地成熟度03 選擇DeepSeek應用場景

          如何選擇AI應用場景,歸根結底都是圍繞降本增效、提升體驗和模式創新三個方面來展開的,這些也是各行業智能化轉型的終極目標。

          首先關注戰略匹配度,看是否符合這三個方面的目標,其次是技術支撐,重點考慮是否是生成式AI的應用場景,以及通過哪些技術路徑來支持場景落地。

          另外就是數據和AI基礎設施:數據層面,需要具備精標注數據、反饋數據,以及垂類語料(無標注數據)條件;算力方面提供AI計算支撐;基礎大模型方面,這是應用AI的最基礎條件,用戶需要考慮大模型的開源/閉源路線。目前開源路線已得到極大發展,尤其是DeepSeek生態已快速形成并在規?;瘮U張,芯片廠商、云廠商、軟件廠商都在主動接入或適配,未來將會持續擴張。擁抱DeepSeek是一種更高性價比的選擇。

          04 初步評估可行性

          選定場景后,我們需要對某個特定場景進行初步可行性判斷,這個判斷需要業務、技術和工程角色共同參與評估。

          • 業務如何判斷呢?DeepSeek的優異性能和獲得的便利性,讓我們可以隨時進行場景驗證。例如,業務方是合同審核部門,場景是審核合同里的關鍵內容是否缺失,那么可以基于DeepSeek進行初步驗證,輸入一段合同文本,輸出就是幾個關鍵字段和它的值,而目標就是提取這些信息,并且內容沒有丟失。這是沒有任何技術和工程參與優化的結果。這個工作業務團隊是完全可以勝任的,如果讓技術部門來判斷,可能會存在業務知識缺少的情況,無法準確判斷業務場景的可行性。

          • 技術部門則重點關注基礎模型本身的能力,也就是大模型在預訓練階段基本定型的,主要包括它在預訓練階段用的知識、采用了哪些語言、有沒有用一些帶有邏輯推理的語料。在這些方面,DeepSeek模型也表現出極為出色的能力,尤其是671B滿血版,經歷了SFT冷啟動、COT數據、GRPO強化學習算法及全場景強化學習等多個創新點,模型已具備高效及強大的思考能力。

          • 最后是工程角度,在DeepSeek出現之前,使用大模型需要掌握一些Prompt(提示詞)優化技巧,有時還需要結合few shot(示例),以及思維鏈等方式,來激發大模型本身的能力。而DeepSeek本身已經表現出了以接近人類專家的水平的思考過程,這就極大降低了Prompt設計工作的復雜程度。

          各行業用戶內部,知識問答的需求將會爆發式增長,因為接入DeepSeek來實現企業RAG(檢索增強)生成這種方式,整體的工程化落地難度也大大降低,越來越多用戶會開始建設知識問答應用,以服務內部或外部客戶。

          同樣的,DeepSeek本身對語言理解能力以及對指令的遵循能力變得更好,所以進行大模型SFT(Supervised Fine-Tun-ing)微調甚至進行二次預訓練,這種場景將會大幅減少,對其工程化團隊的要求將大幅降低。

          05 準備DeepSeek落地所需資源

          在確定初步可行之后,即可開始準備大模型落地所需資源。主要從4個方面準備:與建設場景相匹配的數據、算力、開發工具和團隊。

          1. 準備數據

          根據選擇場景的不同,需要準備的數據也會有很大不同:

          • RAG場景:

          文檔預處理(如文檔格式轉換等)、文檔解析(PDF識別,版式識別)、OCR(圖像轉文字)、文檔切分(切分為小的片段)、數據增強(提取QA、生成摘要)。

          • 大模型微調場景:

          對于少數具備較強AI技術能力的團隊,在微調場景需要準備:精標注QA數據(問答對形式)、準備指令數據(如人設遵循、輸出格式要求等)。需要確保數據準確性(例如做過濾低質量,去掉重復數據等)、數據多樣性(要能夠覆蓋各種真實應用場景)、數據一致性(數據不沖突)、數據增強(生成QA、摘要)等。

          • 二次預訓練場景:

          這種需求只有在某個垂類領域的頭部企業才會選擇,包括:專業領域的語料(如金融、醫療等專業術語,這些領域使用語境等)。需要確保數據多樣性(如覆蓋場景種類足夠多)、數據規模足夠大(一般要達到數十億級token以上)、一定的配比數據(增加通用領域數據做二次預訓練,如1:1配置)、數據處理能力(去除重復數據、低質量數據、隱私數據、不合規數據等)。

          2. 準備算力

          在大模型建設中,算力的多少決定了訓練速度、效率和模型表現,是推動模型快速落地的關鍵資源。那么要準備多大的算力才能滿足實際應用需求?這里有一些經驗,可以用于快速進行算力數量估算(此處僅考慮GPU算力)。

          對于訓練場景,全參微調所需的總顯存一般為模型參數量(以B-十億為單位)的20倍,例如70億(7B)參數大模型,至少需要140G顯存,按照單卡80G顯存,則對應的GPU卡至少需要2張。而130億(13B)參數大模型,至少需要260G顯存,按照單卡80G顯存,則對應的GPU卡至少需要4張。

          3. 準備工具

          基礎大模型的選擇,往往決定了應用效果的基線。對于大多數用戶來說,首選是DeepSeek R1系列蒸餾模型,在同等參數量下,相比其它開源大模型,它能夠取得更好的效果。而在6個蒸餾模型中,32B參數量大模型能夠在效果和落地成本方面取得較好的平衡,可以作為應用首選。

          DeepSeek R1系列蒸餾模型

          如果是為了解決特定場景下的應用目標問題,則需要AI應用開發工具,例如開發一個RAG應用、Agent智能體應用等,需要評估應用開發工具對場景效果的支撐。

          模型微調和部署工具選擇上,基于長遠考慮,首先關注對資源的利用率和整體性價比,其次需要考慮工具的完整性、兼容性、易用性、可靠性、以及安全性 。例如,在性價比方面,在相同的基礎大模型條件下,平臺對于算力資源消耗和模型服務性能如何;使用時學習門檻是否足夠低,操作是否足夠簡便,過程是否自動化等。

          模型微調和部署工具選擇

          4. 搭建團隊

          大模型項目更依賴于數據驅動的效果調優、模型微調和二次預訓練等技術,而傳統系統更關注業務流程的實現與系統的長期穩定性。用戶在推動大模型項目落地時,應根據首先落地的場景,來做差異化的團隊配置。

          例如,初期只選擇內部流程自動化場景,只需要做Prompt優化和系統對接就可以,所以在AI團隊上重點配置提示詞優化工程師、工程開發工程師;而在RAG應用場景,就需要文檔數據預處理、檢索優化等工程師。

          06 分階段實施

          階段一:場景為王&運營提效

          場景為王,指的是選擇最簡單、最容易做出效果的場景去建設。當前,基于DeepSeek模型的RAG應用正成為各行業智能化轉型的關鍵突破口。DeepSeek推動大模型技術逐步走向產業化規?;涞?,用戶亟需找到投入產出比高、見效快的AI應用場景。RAG技術憑借其“知識檢索+智能生成”的雙重能力,正成為用戶構建智能系統的首選方案。

          對于希望快速實現AI價值的用戶,建議優先選擇知識密集度高、流程標準化強的場景切入,例如技術文檔問答或產品知識庫建設。通過小步快跑的方式,用戶可在3個月內看到明顯的效率提升,為后續更復雜的AI應用奠定基礎。在實施過程中,要特別注意建立知識更新閉環,持續優化檢索策略和生成質量,最終形成具有特色的智能知識中樞。

          相較于其它通用大模型,DeepSeek模型在構建企業RAG(檢索增強生成)應用中的優勢不僅體現在成本降低技術性能提升,更能通過開源生態為用戶提供從基礎應用到深度智能的全鏈路支持。

          例如推理成本降低,DeepSeek在復雜推理任務(如金融研報生成)中實現了70%的成本降低。其蒸餾模型(如DeepSeek-R1)在更小規模下仍能保持高性能,減少了對高端計算資源的依賴;

          長思維鏈與自我驗證,通過強化學習和模型蒸餾技術,DeepSeek能在小參數模型中實現長推理鏈與自我驗證,滿足用戶對復雜場景的高準確率要求;

          開源商用授權,DeepSeek模型提供開源商用授權政策,用戶可免費用于微調、量化及衍生開發,降低技術門檻和法律風險。

          以知識庫檢索問答(RAG)方案為例,用戶正將AI應用從單點工具升級為全域知識中樞。某處于裝備制造產業鏈下游的傳統型企業,需要對接上千家上游元器件供應商。企業有數百名產品設計人員,主要工作是結合工藝參數的需求,進行物料選型,再給后續環節使用。

          物料總計有3000余個,對應1萬多份物料技術規范書文檔。員工通過手動整理參數表格并結合人工核對來完成物料篩選,完成一個場景的物料選型往往需要數天時間,嚴重影響生產效率。當Deepseek出現后,用戶可以通過對話的方式,讓大模型準確回答其所需要的物料,使得整個過程縮短到分鐘級,準確率達到90%以上。用戶借助該能力中樞,正嘗試對多個內部業務系統進行智能提效,如應用于研發、生產、供應鏈、銷售、售后服務系統等,大幅提升效率和競爭力。

          另外需要注意的是,在企業級RAG應用上線后,需同步進行運營提效工作,持續收集場景反饋數據,對落地場景效果持續優化,才能在初始落地階段產生明顯價值。

          階段二:場景擴展

          基于第一階段的成功,用戶要深入到核心業務場景去解決復雜的場景問題,發揮AI的價值,從輔助性角色變成核心角色。例如銷售機器人、個性化服務機器人、運維機器人等。這個階段的特點是復雜度更高,往往不是單靠大模型能完成的,需要借助小模型、智能體等來協作完成。

          階段三:持續優化

          不管是什么樣的AI模型,部署后,其固有知識相對不會變化,但業務場景不是一成不變的,如果不持續優化模型,它的效果會持續衰減。另外,隨著落地的場景越來越多,并發量越來越大,它所消耗的資源也成倍增加,如果不對它的底層資源進行優化,后續將有非常大的成本支出。

          綜上,我們可以通過不斷采集、反饋、優化,形成數據閉環,來持續對場景做提效。構建數據反饋閉環是確保企業大模型適應業務變化的基礎,優化后的模型重新部署到業務場景中,繼續收集新的數據,形成持續反饋的閉環。這不僅讓模型適應業務的變化,還能不斷提高其在核心場景中的應用效果。

          構建數據反饋閉環

          階段四:賦能核心業務

          這是AI落地的終極目標,AI大量融入到關鍵業務鏈條中,深入核心業務,比如制造業的研產供銷服等環節。未來,用戶的AI建設不斷深入,將會覆蓋到全部鏈條,例如——

          • 在研發板塊,可以充分利用大模型的理解以及調用外部工具、生成代碼的能力,輔助進行產品工藝設計和參數選擇;

          • 在生產板塊,可以通過語音自然語言交互,對機器人進行操作;

          • 在銷售板塊,大模型結合數字人,能夠為用戶提供更好的體驗和服務響應;

          • 在設備運維方面,能夠及時給出設備故障的維修方案;

          • 在運營方面,通過大模型提供個性化的數據分析和運營報告。

            ……

          07評估

          對大模型項目建設評估不僅是對一次項目執行結果的評估,更是對階段性工作的評估,包括但不僅限于項目業務價值、用戶體驗、成本效益、模型性能與合規性、安全性等多個維度的綜合評估。通過建立持續的監控與反饋機制,優化運營成本,分析模型的擴展潛力,并結合未來發展戰略,用戶可進一步確保大模型項目的成功和長期價值。

          對大模型項目建設評估

          08持續運營

          只有堅持長期在數據和場景方面的運營深耕,才有助于構建持續競爭優勢,這個過程可重點關注數據飛輪持續化和場景運營精細化。

          數據飛輪持續化:

          • 整合多源數據(銷售、客服、供應鏈……),統一數據質量標準,設置專門的數據治理團隊;

          • 設置模型效果評估標準(基于標準測試集和基于業務反饋結果);

          • 收集線上/線下反饋數據;

          • 關鍵指標監控(性能指標、業務指標,如轉化率、復購率);

          • 明確實施微調優化的準入標準;

          • 通過持續的數據積累、數據反饋閉環,推動模型的不斷優化和迭代。

          場景運營精細化:

          • 一把手牽頭,發動各個業務部門梳理業務場景,細化到最小粒度場景;

          • 對全量場景做價值度評估,排優先級;

          • 建立業務部門和AI團隊的場景對接機制,明確場景提出-評估-立項/關閉-建設-評估-運營的整個閉環;

          • 建立效果評估機制,對用戶反饋做閉環跟蹤;

          • 挖掘新場景,鼓勵內部做業務場景與AI結合的創新。

          分割線

          在這場由DeepSeek引發的智能化浪潮中,各行業用戶的數字化轉型路徑都在發生變化,深信服將在這場變革中,助力用戶更順利地實現AI+云化升級。

          接下來,我們還將為用戶解鎖圍繞DeepSeek場景的最佳實踐及一朵云承載方案,敬請期待!

          久久在精品线影院,久久视频这里只精品亚洲,99欧美精品含羞草,欧洲精品性爽视频