DeepSeek R-1被視為一種完全開放的模型,這意味著任何人都可以采用基本的代碼庫,對(duì)其進(jìn)行調(diào)整,甚至根據(jù)自己的需求進(jìn)行微調(diào)。從技術(shù)的角度來看,DeepSeek R-1(通常以R1的縮寫為R1)源于一種稱為DeepSeek-V3的大型基本模型。然后,實(shí)驗(yàn)室通過在高質(zhì)量的人類標(biāo)記的數(shù)據(jù)和增強(qiáng)學(xué)習(xí)(RL)上結(jié)合了監(jiān)督的微調(diào)(SFT)來完善該模型。
如何在本地運(yùn)行DeepSeek?
要在本地運(yùn)行DeepSeek R-1,我們將使用一種稱為Ollama的工具。Ollama是一種免費(fèi)的開源工具,允許用戶在其計(jì)算機(jī)上本地運(yùn)行大型語言模型(LLMS)。它可用于MacOS,Linux和Windows。前往Ollama官方網(wǎng)站,然后單擊“下載”按鈕。將其安裝在系統(tǒng)上。
安裝完成后,在終端或命令提示符中運(yùn)行以下命令以檢查Ollama是否安裝成功:
ollama -v
在“模型”選項(xiàng)卡下,搜索關(guān)鍵字“ DeepSeek”,您應(yīng)該在搜索列表上的第一個(gè)項(xiàng)目上看到“ DeepSeek-r1”。
單擊它,然后在模型部分下進(jìn)行,您會(huì)注意到有多個(gè)型號(hào)尺寸從50億到6710億個(gè)參數(shù)。根據(jù)經(jīng)驗(yàn),較大的型號(hào)需要更強(qiáng)大的GPU才能運(yùn)行。
諸如80億參數(shù)版本之類的較小型號(hào)可以使用8GB的VRAM在GPU上運(yùn)行。較大的模型需要更多的資源(請(qǐng)參閱下面的VRAM和GPU要求部分)。要下載并運(yùn)行80億個(gè)參數(shù)模型,請(qǐng)使用以下命令:
ollama run deepseek-r1:8b
該模型將開始下載(約4.9GB)。在繼續(xù)前,請(qǐng)確保您有足夠的磁盤空間。
下載后,該型號(hào)將在您的計(jì)算機(jī)上本地運(yùn)行。您可以立即與之聊天。
其他ollama可以做的事情:?
- 在本地運(yùn)行LLMS,包括Llama2,Phi 4,Mistral和Gemma 2
- 允許用戶創(chuàng)建和共享自己的LLM
- 捆綁型號(hào)的權(quán)重,配置和數(shù)據(jù)到一個(gè)軟件包中
- 優(yōu)化設(shè)置和配置詳細(xì)信息,包括GPU使用
GPU和VRAM要求
DeepSeek-R1的VRAM要求取決于模型大小,參數(shù)計(jì)數(shù)和量化技術(shù)等因素。以下是DeepSeek-R1及其蒸餾模型的VRAM需求的詳細(xì)概述,以及推薦的GPU:
VRAM使用的關(guān)鍵說明:
- 用于較大型號(hào)的分布式GPU設(shè)置:運(yùn)行DeepSeek-R1-Zero和DeepSeek-R1需要實(shí)質(zhì)性的VRAM,需要分布式GPU配置(例如,在多GPU設(shè)置中NVIDIA A100或H100)才能進(jìn)行最佳性能。
- 蒸餾模型的單GPU兼容性:蒸餾模型被優(yōu)化,可在較低的VRAM需求的單個(gè)GPU上運(yùn)行,僅為0.7 GB。
- 額外的內(nèi)存用法:可能會(huì)消耗額外的內(nèi)存,以進(jìn)行激活,緩沖區(qū)和批處理處理任務(wù)。
為什么要在本地運(yùn)行?
當(dāng)然,DeepSeek的Web聊天機(jī)器人和移動(dòng)應(yīng)用程序是免費(fèi)的,并且非常方便。您無需設(shè)置任何東西,并且諸如DeepThink和Web搜索之類的功能都可以在進(jìn)來。但是,有幾個(gè)原因?yàn)槭裁丛诒镜剡\(yùn)行它可能是一個(gè)更好的選擇:
- 隱私?:當(dāng)您使用Web或應(yīng)用程序版本時(shí),您的查詢以及任何文件附件都會(huì)發(fā)送到DeepSeek的服務(wù)器進(jìn)行處理。該數(shù)據(jù)會(huì)怎樣?我們不知道。在本地運(yùn)行該模型可確保您的數(shù)據(jù)停留在機(jī)器上,從而使您完全控制自己的隱私。
- 離線訪問?:在本地運(yùn)行該模型意味著您不需要Internet連接。如果您旅行,處理斑點(diǎn)Wi-Fi,或者只是更喜歡離線工作,那么本地設(shè)置可讓您隨時(shí)隨地使用DeepSeek。
- 未來的防護(hù)?:DeepSeek的服務(wù)現(xiàn)在可能是免費(fèi)的,但這不太可能永遠(yuǎn)持續(xù)下去。在某個(gè)時(shí)候,他們需要貨幣化,并且可能會(huì)隨后使用限額或訂閱費(fèi)。通過本地運(yùn)行該模型,您可以完全避開這些限制。
- 靈活性?:使用本地版本,您不僅限于默認(rèn)設(shè)置。想微調(diào)模型嗎?將其與其他工具集成在一起?構(gòu)建自定義接口? DeepSeek R-1的開源本質(zhì)為您帶來了無盡的可能性。
在這一點(diǎn)上,尚不清楚DeepSeek如何處理用戶數(shù)據(jù)。如果您不太擔(dān)心數(shù)據(jù)隱私,則使用Web或移動(dòng)應(yīng)用程序可能是可以使用的方式,因?yàn)樗鼈兏子谑褂貌⑻峁〥eepThink和Web搜索之類的功能。但是,如果您是關(guān)心數(shù)據(jù)結(jié)束的地方,那么在本地運(yùn)行該模型是一個(gè)很好的考慮。
DeepSeek型號(hào)的設(shè)計(jì)旨在即使在不強(qiáng)大的硬件上運(yùn)行良好。盡管諸如DeepSeek-R1-Zero之類的較大型號(hào)需要分布式的GPU設(shè)置,但蒸餾版使得可以在單個(gè)GPU上順利運(yùn)行,并具有較低的要求。如果您不喜歡使用終端,則可以隨時(shí)使用諸如Gradio或Chatbox AI之類的工具添加簡(jiǎn)單的UI。