DeepSeek助力群杰科技實現用印、合同數字化風控能力再提升
群杰產品與DeepSeek深入融合應用成果
群杰產品接入DeepSeek R1帶來的實際應用價值
群杰科技旗下智能印控、合約衛士等行業領先數字化風控產品均已全面接入DeepSeek-R1系列模型對AI功能模塊升級,為廣大客戶伙伴提供了更強的智能體驗及本地化部署的印章/合同全生命周期管理系統新版本。
本次圍繞合同印控全流程管理,對群杰合約衛士的合同起草、審查、用印、履約、歸檔等業務場景相關的功能模塊進行了全面的智能化提升,通過DeepSeek-R1系列模型的接入提供了更加智能的業、財、法風控能力,合同AI審查信息的有效率提升至99.2%,進一步幫助企業全面提升合同風險防控和數據應用能力,并在提升能力的同時,顯著降低本地化部署成本。
合同AI審查模塊效果
合同AI審查模塊DeepSeek-R1推導過程
合約衛士新版本智能化顯著提升的業務場景方面
● 合同智能起草和批量生成
根據應用場景、具體業務信息自動匹配合同模板,補全合同簽約方、金額、支付條款、履約條款等業務信息,自動生成合同,支持根據業務清單批量生成合同。
● 合同的合規審查和風險評估
對合同內容條款進行深度分析,識別其中可能存在的法務風險、合規問題、業務不合理的條款。基于比以往更強大的推理能力,能夠對合同中的潛在的計算邏輯等業務風險進行預警。
● 合同信息的提取和比對
快速從合同文本中識別抽取合同雙方主體、合同金額、履行期限、違約責任等關鍵信息,形成結構化數據,為合同信息的快速錄入、計算、分析、比對提供便利。
快速對比不同版本的合同,識別出其中的差異。在合同修改過程中,系統可以快速找出新舊版本之間的條款變化、文字修改等,并生成詳細的比對報告。對合同的不同版本進行管理,記錄每次修改的時間、人員、內容及原因,確保合同版本的可追溯性。
● 合同用印文件識別與分析
使用群杰智能印章或電子印章進行線下線上智能化合同用印管理,在原有的獨家隱形水印+OCR識別技術基礎之上,進一步提升文本識別率(超99.9%),并大幅提高識別效率,降低大型集團企業客戶對服務器GPU資源的依賴,從而降低采購成本。
● 履約監控和預警
合同蓋章生效后,結合合同履約條款和實際業務數據,拆解為履約任務進行跟蹤,實時監控合同的履約進度。當出現履約延遲或潛在違約風險時,及時發出預警,提醒采取相應的措施。
● 合同的智能歸檔管理和智能檢索
將合同按照預設的分類規則自動歸檔(如合同類型、責任部門、合同金額、風險等級等),方便進行合同的管理和存儲。
通過自然語言處理技術,支持用戶使用自然語言進行合同檢索。如,用戶可以通過輸入“所有2025年簽訂的50萬元以上的采購合同”這樣的自然語言指令,快速找到相關合同并進行概要統計和分析、摘要內容提示。
DeepSeek應用指南與技術啟示
應用DeepSeek R1我們需要什么樣的資源
DeepSeek可在windows、macOS或Linux系統上部署服務,DeepSeek模型下載完成后,可在終端中輸入我們的問題或指令。顯卡的顯存占用和利用率取決于所選模型的大小和我們的硬件配置。
下表為DeepSeek R1系列大模型推薦使用的GPU顯存大小以及型號。針對相關業務需要,同時考慮成本問題,我們可以選擇的模型參數范圍從1.5B~70B之間。主要區別如下:
● 若業務需求以輕量級合同抽取、標注輔助為主,1.5B~7B規模的模型已經足夠,成本較低。
● 若需要更強的理解能力、復雜合同分析,可選擇 8B~14B規模的模型,結合多卡4090或A100進行推理。
● 70B級別模型適用于需要高精度NLP處理的場景,但部署成本高,建議僅在特定高價值任務中使用。
表 DeepSeek R1系列大模型推薦使用的GPU參考
DeepSeek-R1-Distill-Qwen-7B在RTX4090上的使用效果
我們在NVIDIA GeForce RTX 4090、驅動版本: 550.120、Cuda=12.4、python=3.10.0的服務器上測試了DeepSeek-R1-Distill-Qwen-7B的推理效果,結果顯示顯存占用約15.3GB,GPU的利用率高達97%。
在測試的過程中我們設置max_new_tokens=2000,審查的測試合同字數為969個字,共耗時24.16秒,平均生成速度約為 82.8 tokens/秒。下圖為我們使用DeepSeek的輸出過程與輸出結果。
圖 DeepSeek-R1 -Distill-Qwen-7B 服務器測試審查效果
DeepSeek現象:技術爆發背后的啟示
Q:DeepSeek 技術的爆發,對于中國大模型未來發展道路有哪些啟示?對中國企業的一些啟示?
A:DeepSeek 團隊秉持技術理想主義,以實現 AGI 為目標,憑借長期積累和堅定執行力推動技術進步。其成功并非偶然,而是多年深耕的結果。創始人梁文峰的資金支持為團隊提供了探索的自由,但更多有潛力的國內團隊仍需要更完善的支持體系,以推動原始創新。DeepSeek的發展路徑展現了長期主義的重要性,他們的成功經驗值得學習,但技術路線不應被簡單復制,而應在此基礎上探索更具創新性的突破。
DeepSeek的成功為中國企業提供了以下啟示:堅持長期主義,專注技術創新;重視開源與開放合作;優化資源配置,實現高效研發。
Q:DeepSeek-R1是全新物種LLM,Think能解鎖無限可能嗎?
A:雖然 DeepSeek-R1 被稱為推理大模型,但本質上仍然是一款大語言模型,其核心能力與 OpenAI o1 相當,并未帶來突破性的能力變革,并且在一些推理準確性測試中,DeepSeek-R1的幻覺率高達14.3%,顯著高于其前身DeepSeek-V3的3.9%。它的獨特之處在于引入 Think過程,通過拆解推理來提升推理表現(類似于我們解一道復雜數學題時,會先拆解成多個小步驟),但這一機制帶來了額外的時延,并非適用于所有場景。因此,DeepSeek-R1 并非真正意義上的“全新物種”,而是對推理方式的一種優化,而 Think也并非萬能鑰匙,而是以時間換取更精細的推理鏈條。
Q:使用DeepSeek系列模型對合同進行審查、要素抽取等工作,與應用其他LLM相比其優勢有哪些?
A:基于指令型架構,依賴于用戶提供的明確指令或提示,缺乏自主推理能力,對合同條款的理解可能較為表面。而采用推理型架構,能夠在回答問題前進行“自問自答”式的推理思考,模擬人類的深度思考過程,從而提升對合同條款的理解和分析能力。通過深度思考過程,能夠更深入地理解合同條款的含義,識別潛在的法律風險和隱含意圖。
Q:為什么說DeepSeek R1能夠取得如此全球性的成功呢?
A: DeepSeek R1 能夠取得全球性成功,關鍵在于其開放普惠的策略和技術創新的突破。相比 OpenAI 的 o1 高昂的收費和封閉的策略,DeepSeek R1 讓更多人切實體驗到了深度思考的震撼,類似 2023 年初 ChatGPT 帶來的現象級影響。 更重要的是,它在有限算力條件下,通過算法創新突破了算力瓶頸,證明了即使資源受限,也能實現全球領先的 AI 進展。這對中國 AI 發展意義重大,也揭示了 AI 未來普惠化的核心——提升效率,讓通用人工智能真正觸達每個人。