2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色

分享

DeepSeek:黑天鵝降臨硅谷

 okxso 2025-01-27
這是一個信息爆炸的時代,也是一個信息嚴(yán)重污染的時代。所以,我對任何信息都不會輕信,尤其是面對重大利好,更加「存疑」。對我來說,排除信息污染的最好辦法,就是交叉對比,正反面都看。
過去48小時內(nèi),我?guī)缀醵寂菰?span>X上,瀏覽各種關(guān)于Deep Seek的消息,在英語世界,基本上是壓倒性正面評價,這時候,我就特別想看看負(fù)面的評論,找了一圈,的確有。
主要分為兩類:
一類,為了反而反,尤其是一些海外的反中人士,任何關(guān)于中國的新聞,他們都會給出負(fù)面的評價,這類信息簡直就是垃圾。但看看也好,至少可以知道垃圾是什么樣子。
Image
另一類,是業(yè)內(nèi)人士的負(fù)面評價,其中第一個,也是最鷹派的聲音,居然來自一個華裔業(yè)內(nèi)人士——Alexandr Wang。
首先,此人的名字有點奇怪,第一次看到,我以為是CNBC拼錯了,一般情況下,Alexander是英語中最常見的拼寫形式,也是國際通用的版本。而Alexandr,則是某些東歐語言(如俄語、捷克語等)的拼寫形式。一個美國華裔,居然用東歐的名字,有點蹊蹺。但我定睛一看,確實是Alexandr
其次,這位王先生,不僅名字奇怪,更有著與眾不同的背景。他出生于1997,Scale AI的創(chuàng)始人兼CEO。24歲時,Alexandr Wang成為了世界上最年輕的「白手起家」億萬富翁。根據(jù)福布斯的說法,截至20247月,他的身價為20億美元。
是中國移民的兒子,父母都在洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)擔(dān)任物理學(xué)家,核武器就誕生在這個實驗室。中國人能在這種單位工作,非常罕見。
Alexandr 從小就對數(shù)學(xué)和計算機(jī)編程充滿熱情。他在2013年獲得了美國隊的數(shù)學(xué)奧林匹克資格。在十幾歲時,他就在美版知乎Quora擔(dān)任軟件程序員。隨后,他在麻省理工學(xué)院學(xué)習(xí)計算機(jī)科學(xué),但中途退學(xué),創(chuàng)辦了Scale AI,成了硅谷的AI神童。
Alexandr說:Deep Seek至少有5萬張英偉達(dá)H100顯卡,只不過因為制裁的原因,不方便說而已。事后,我看了好幾遍CNBC電視臺的采訪,他的原話是as my understanding,也就是「按照我的理解」,而沒有任何實錘的證據(jù)。
根據(jù)Deep Seek的說法,訓(xùn)練模型只用了2048H800顯卡,也就是H100的閹割版,價格也只有H1003萬美刀)的三分之一。正因為用了低配的硬件,才體現(xiàn)了Deep Seek的創(chuàng)新價值。
Image
Alexandr Wang暗示了,Deep Seek只不過也是大力出奇跡而已,根本沒有什么創(chuàng)新。
那么5萬張H100顯卡意味著什么呢?
今年,馬斯克用全球最大AI超算Colossus轟動了整個世界,這臺超算也只配備了10萬張英偉達(dá)H100顯卡。
即便Alexandr Wang說的是真話,5萬張英偉達(dá)H100顯卡,總價就至少15億美元。折合一百多億人民幣。一個小小的幻方公司,能拿出這么多錢嗎?就算有,H100美國禁運,中國大陸根本沒貨,也很難買到。
再退一步講,就算Deep Seek能拿出這么多錢,買5萬張英偉達(dá)H100顯卡,他的成本就和Open AI不相上下了,但Deep Seek是開源免費的,而Open AI200美元一個月。
因為Deep Seek,我也是人生第一次,學(xué)會了用API。我用中國手機(jī)開了一個賬戶,就送10元人民幣,我用Deep Seek API翻譯文本,百萬輸入 tokens2元,用了一個晚上,才花了0.11元。這已經(jīng)不能算白菜價了,幾乎就是免費!從售價倒推成本,Deep Seek也不可能擁有5萬張H100顯卡。
總之,無論從哪個角度看,Alexandr Wang的論點都站不住腳,但他的說法,依然有價值。
一方面,證明了Deep Seek的技術(shù)真的牛叉,已經(jīng)牛到要用5萬張H100顯卡才能訓(xùn)練。
另一方面,說明Deep Seek的影響力太大,以至于Alexandr Wang有點慌了,口不擇言。
Image
那么,為啥Alexandr Wang要慌呢?
我不是什么AI專家,但根據(jù)我這幾天索閱讀的大量信息理解,Deep Seek可能是一只巨型的黑天鵝,她正在硅谷的上空游蕩。
1/ 目前,訓(xùn)練頂級AI模型的成本極其高昂。OpenAI巨頭,需要擁有數(shù)萬個H100顯卡的大型數(shù)據(jù)中心。每塊最低3萬美元,總價就要十幾億美元,而且耗電量驚人,需要一整座發(fā)電廠提供電力。他們僅在訓(xùn)練模型上,就要花費數(shù)億美元。
2/ Deep Seek突然出現(xiàn)并說:哈哈,如果我們花 500 萬美元做這件事會怎么樣?」他們不只是說說而已,而是真的做到了。Deep Seek的模型在許多任務(wù)上,甚至擊敗了 GPT-4 Claude。硅谷的人工智能世界,瞬間就懵了,AI天才Alexandr Wang語無倫次了。
3/ DeepSeek怎么做到的?他們從頭開始重新思考一切。傳統(tǒng)AI就像是把每個數(shù)字都寫成 32 位小數(shù)。DeepSeek 說:「如果我們只使用8位小數(shù)呢?」結(jié)果,它仍然足夠準(zhǔn)確!瞬間,所需內(nèi)存就減少了75%
4/ 然后是他們的「多標(biāo)記」系統(tǒng)。普通人工智能的閱讀方式就像一年級學(xué)生一樣:「..........................................」,逐字閱讀。但DeepSeek一次讀完整段話。速度快2倍,準(zhǔn)確率高90%,當(dāng)你處理數(shù)十億個單詞時,這一點很重要。
5/ 但真正聰明的是:他們建立了一個「專家系統(tǒng)」,而沒有使用一個試圖了解一切的大型人工智能(比如讓一個人同時成為醫(yī)生、律師、工程師、木匠),只在需要時才激活特定專家,節(jié)省了大量參數(shù)
6/ 而傳統(tǒng)模型呢?所有1.8萬億參數(shù)始終處于活動狀態(tài)。與此同時,DeepSeek總共6710億個參數(shù),一次只激活370。這就像擁有一支龐大的團(tuán)隊,但只召集每個任務(wù)真正需要的專家。
7/ 結(jié)果令人震驚,訓(xùn)練成本:數(shù)億美元 → 500萬美元;所需GPU100000 → 2000  API 成本:便宜 95%;可以在普通游戲顯卡上運行,而不是數(shù)據(jù)中心硬件。
8/ 最瘋狂的部分——DeepSeek是開源的(完全免費)。任何人都可以使用,代碼是公開的。技術(shù)論文解釋了一切,這不是魔術(shù),只是令人難以置信的巧妙工程。現(xiàn)在x最流行的一個梗,Open AI  Closed AI(閉源AI),取而代之的是DeepSeek,才是真正的Open AI (開源AI)。
9/ 為什么DeepSeek很重要?因為它打破了「只有大型科技公司才能涉足人工智能」的神話。你不再需要價值數(shù)十億美元的數(shù)據(jù)中心,幾個好的游戲顯卡,就可以做到這一點。
10/ 英偉達(dá)來說,這很可怕。他們的整個商業(yè)模式都建立在利潤率高達(dá)90%的昂貴顯卡的基礎(chǔ)上,比如售價高達(dá)三四萬美元的H100,奇貨可居,有錢都買不到。如果每個人都能突然用普通的游戲顯卡AI……那么,你就知道問題所在了。
11/ 關(guān)鍵在于:DeepSeek 的團(tuán)隊不到200人,但Meta的團(tuán)隊僅薪酬就超過了DeepSeek 的整個訓(xùn)練預(yù)算……Meta的模型卻不如DeepSeek。
12/ 這是一個經(jīng)典的顛覆故事:既有者優(yōu)化現(xiàn)有流程,而顛覆者重新思考根本方法。
13/ DeepSeek就像一次地震,余震太大:人工智能開發(fā)變得更加容易,競爭加劇,大型科技公司的「護(hù)城河」看起來更像水溝,硬件要求(和成本)大幅下降
14/ 當(dāng)然,OpenAI 等巨頭不會坐以待斃但一切都要顛覆,再也不是大力出奇跡的模式了
DeepSeek這只黑天鵝,煽動翅膀,整個硅谷都會被波及,效應(yīng)可以總結(jié)為以下幾點。
AI初創(chuàng)企業(yè)危機(jī)Deep Seek的高性能可能導(dǎo)致大量購買英偉達(dá)顯卡AI初創(chuàng)企業(yè)破產(chǎn),釋放大量二手GPUScale AICEO創(chuàng)始人Alexandr Wang來說,這是攸關(guān)生死的存亡之爭,口出惡言,也可以理解。
數(shù)據(jù)中心業(yè)務(wù)受挫:大型數(shù)據(jù)中心運營商,其租用英偉達(dá)顯卡的商業(yè)模式將受到?jīng)_擊。
科技巨頭減緩采購:科技巨頭們可能因庫存積壓,減少對英偉達(dá)顯卡的采購。
英偉達(dá)前景堪憂:上述因素疊加,可能導(dǎo)致英偉達(dá)的業(yè)務(wù)全面下滑。
X上,有一個金融大V說了一句:deepseek better not be the real deal...deepseek 最好不是真的......)然后配了一張讓人不寒而栗的圖。
Image
75年高點:圖表顯示,美國股市位于75年來的最高點。
Magnificent 7:這個詞指的是目前美國股市中表現(xiàn)最好的七家科技巨頭公司,它們在很大程度上推動了美國股市的上漲。
兩次泡沫:分別是上世紀(jì)60年代的Nifty 50泡沫和90年代的互聯(lián)網(wǎng)泡沫。這兩次泡沫都導(dǎo)致了股市崩盤,這一次,deepseek來了...美股會崩嗎?
Image
最后,我們在看一看,Deep Seek團(tuán)隊剛在康奈爾發(fā)表的論文,其中每一個作者都值得我們銘記,大部分都是30歲以下的年輕人,來自國內(nèi)的頂尖大學(xué),有的還在讀博士,其中,無人具有海外的學(xué)術(shù)背景。這再次表明中國在大學(xué)教育質(zhì)量上已經(jīng)趕上美國,并且未來幾十年中國在STEM畢業(yè)生方面將占據(jù)絕對的數(shù)量優(yōu)勢。
正如DeepSeek創(chuàng)始人梁文鋒所說:我們的價值在于團(tuán)隊,通過這個過程不斷成長和積累專業(yè)知識。建立一個能夠持續(xù)創(chuàng)新的團(tuán)隊,才是我們真正的護(hù)城河。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多