DeepSeek R-1被視為一種完全開放的模型,這意味著任何人都可以采用基本的代碼庫,對其進(jìn)行調(diào)整,甚至根據(jù)自己的需求進(jìn)行微調(diào)。從技術(shù)的角度來看,DeepSeek R-1(通常以R1的縮寫為R1)源于一種稱為DeepSeek-V3的大型基本模型。然后,實驗室通過在高質(zhì)量的人類標(biāo)記的數(shù)據(jù)和增強學(xué)習(xí)(RL)上結(jié)合了監(jiān)督的微調(diào)(SFT)來完善該模型。
如何在本地運行DeepSeek?
要在本地運行DeepSeek R-1,我們將使用一種稱為Ollama的工具。Ollama是一種免費的開源工具,允許用戶在其計算機上本地運行大型語言模型(LLMS)。它可用于MacOS,Linux和Windows。前往Ollama官方網(wǎng)站,然后單擊“下載”按鈕。將其安裝在系統(tǒng)上。
安裝完成后,在終端或命令提示符中運行以下命令以檢查Ollama是否安裝成功:
ollama -v
在“模型”選項卡下,搜索關(guān)鍵字“ DeepSeek”,您應(yīng)該在搜索列表上的第一個項目上看到“ DeepSeek-r1”。
單擊它,然后在模型部分下進(jìn)行,您會注意到有多個型號尺寸從50億到6710億個參數(shù)。根據(jù)經(jīng)驗,較大的型號需要更強大的GPU才能運行。
諸如80億參數(shù)版本之類的較小型號可以使用8GB的VRAM在GPU上運行。較大的模型需要更多的資源(請參閱下面的VRAM和GPU要求部分)。要下載并運行80億個參數(shù)模型,請使用以下命令:
ollama run deepseek-r1:8b
該模型將開始下載(約4.9GB)。在繼續(xù)前,請確保您有足夠的磁盤空間。
下載后,該型號將在您的計算機上本地運行。您可以立即與之聊天。
其他ollama可以做的事情:?
- 在本地運行LLMS,包括Llama2,Phi 4,Mistral和Gemma 2
- 允許用戶創(chuàng)建和共享自己的LLM
- 捆綁型號的權(quán)重,配置和數(shù)據(jù)到一個軟件包中
- 優(yōu)化設(shè)置和配置詳細(xì)信息,包括GPU使用
GPU和VRAM要求
DeepSeek-R1的VRAM要求取決于模型大小,參數(shù)計數(shù)和量化技術(shù)等因素。以下是DeepSeek-R1及其蒸餾模型的VRAM需求的詳細(xì)概述,以及推薦的GPU:
VRAM使用的關(guān)鍵說明:
- 用于較大型號的分布式GPU設(shè)置:運行DeepSeek-R1-Zero和DeepSeek-R1需要實質(zhì)性的VRAM,需要分布式GPU配置(例如,在多GPU設(shè)置中NVIDIA A100或H100)才能進(jìn)行最佳性能。
- 蒸餾模型的單GPU兼容性:蒸餾模型被優(yōu)化,可在較低的VRAM需求的單個GPU上運行,僅為0.7 GB。
- 額外的內(nèi)存用法:可能會消耗額外的內(nèi)存,以進(jìn)行激活,緩沖區(qū)和批處理處理任務(wù)。
為什么要在本地運行?
當(dāng)然,DeepSeek的Web聊天機器人和移動應(yīng)用程序是免費的,并且非常方便。您無需設(shè)置任何東西,并且諸如DeepThink和Web搜索之類的功能都可以在進(jìn)來。但是,有幾個原因為什么在本地運行它可能是一個更好的選擇:
- 隱私?:當(dāng)您使用Web或應(yīng)用程序版本時,您的查詢以及任何文件附件都會發(fā)送到DeepSeek的服務(wù)器進(jìn)行處理。該數(shù)據(jù)會怎樣?我們不知道。在本地運行該模型可確保您的數(shù)據(jù)停留在機器上,從而使您完全控制自己的隱私。
- 離線訪問?:在本地運行該模型意味著您不需要Internet連接。如果您旅行,處理斑點Wi-Fi,或者只是更喜歡離線工作,那么本地設(shè)置可讓您隨時隨地使用DeepSeek。
- 未來的防護(hù)?:DeepSeek的服務(wù)現(xiàn)在可能是免費的,但這不太可能永遠(yuǎn)持續(xù)下去。在某個時候,他們需要貨幣化,并且可能會隨后使用限額或訂閱費。通過本地運行該模型,您可以完全避開這些限制。
- 靈活性?:使用本地版本,您不僅限于默認(rèn)設(shè)置。想微調(diào)模型嗎?將其與其他工具集成在一起?構(gòu)建自定義接口? DeepSeek R-1的開源本質(zhì)為您帶來了無盡的可能性。
在這一點上,尚不清楚DeepSeek如何處理用戶數(shù)據(jù)。如果您不太擔(dān)心數(shù)據(jù)隱私,則使用Web或移動應(yīng)用程序可能是可以使用的方式,因為它們更易于使用并提供DeepThink和Web搜索之類的功能。但是,如果您是關(guān)心數(shù)據(jù)結(jié)束的地方,那么在本地運行該模型是一個很好的考慮。
DeepSeek型號的設(shè)計旨在即使在不強大的硬件上運行良好。盡管諸如DeepSeek-R1-Zero之類的較大型號需要分布式的GPU設(shè)置,但蒸餾版使得可以在單個GPU上順利運行,并具有較低的要求。如果您不喜歡使用終端,則可以隨時使用諸如Gradio或Chatbox AI之類的工具添加簡單的UI。