
溫網(wǎng)時(shí)事新聞,盡管中國(guó)的DeepSeek在全球備受關(guān)注,但人們對(duì)DeepSeek的神秘創(chuàng)始人梁文鋒卻知之甚少。
在今天的BigTakeAsiaPodcast節(jié)目中,主持人K.OanhHa與彭博社的SarithaRai談?wù)摿藥ьI(lǐng)DeepSeek走向人工智能前沿的科技創(chuàng)始人,以及該公司的崛起如何揭示人工智能主導(dǎo)地位的爭(zhēng)奪戰(zhàn)。
以下是經(jīng)過簡(jiǎn)單編輯的談話記錄:
K.OanhHa:今年早些時(shí)候,中國(guó)人工智能初創(chuàng)公司DeepSeek的一款新產(chǎn)品震驚了世界,也震動(dòng)了華爾街。
湯姆·麥肯齊:中國(guó)的DeepSeek正在震驚整個(gè)人工智能世界。隨著其應(yīng)用飆升至下載量排行榜榜首,科技股卻暴跌。
哈:盡管受到全球關(guān)注,但人們對(duì)DeepSeek背后的男人——中國(guó)企業(yè)家梁文峰——卻知之甚少。
SarithaRai:梁文峰無疑是一個(gè)神秘人物。
Ha:彭博社的SarithaRai報(bào)道亞洲的人工智能。
雷:他絕對(duì)是我見過的最難以接近、最低調(diào)的科技企業(yè)家之一。為了說明他有多注重隱私,我們翻遍了他的網(wǎng)站等等,都沒能找到他的任何照片。但他最終出現(xiàn)在了與習(xí)近平主席的一次高調(diào)會(huì)晤中,那張照片被傳遍了全世界,他無處不在。
哈:那這位神秘男子長(zhǎng)什么樣呢?
Rai:他身材苗條,戴著眼鏡,但話不多
哈:娃娃臉?
雷:是的,我想我們可以這樣形容他。
哈:DeepSeek很少回答關(guān)于梁的問題,理由是涉及隱私。但薩麗塔和她的同事們對(duì)這位顛覆科技界的AI系統(tǒng)之人充滿好奇。因此,他們采訪了數(shù)十位熟悉梁工作的人,從前雇員、研究員同事到投資者和業(yè)內(nèi)人士。
雷:我們發(fā)現(xiàn),他確實(shí)非常低調(diào),非常害羞,但卻異常有動(dòng)力、才華橫溢、充滿激情。我認(rèn)為他在某種程度上把DeepSeek視為一項(xiàng)使命,旨在在人工智能領(lǐng)域建立中國(guó),努力確保中國(guó)成為人工智能領(lǐng)域一支不可忽視的力量。
哈:歡迎收聽彭博新聞社的《亞洲大事記》。我是阿恩·哈。每周,我們都會(huì)帶您深入了解一些全球最大、最強(qiáng)大的經(jīng)濟(jì)體,以及推動(dòng)這個(gè)瞬息萬變的地區(qū)的市場(chǎng)、巨頭和企業(yè)。今天的節(jié)目:梁文峰是誰?我們將了解這位帶領(lǐng)DeepSeek走在人工智能前沿的神秘科技創(chuàng)始人。此外,該公司的迅速崛起又能為我們揭示中美人工智能競(jìng)賽的哪些信息?
哈:薩麗莎,謝謝你加入我們。我對(duì)人工智能很著迷。你們的故事講得真有趣。我們可以先聊聊——梁文峰是誰?我們對(duì)他的出身了解多少?
賴:蘇亮大約40歲,出生在廣東省一個(gè)叫米里嶺的小村莊。他的父母是學(xué)校老師,主要教小學(xué)。他非常聰明,后來在浙江大學(xué)學(xué)習(xí),并在那里獲得了碩士學(xué)位。
哈:在浙江大學(xué),梁和他的朋友們沉浸在各種科技領(lǐng)域:機(jī)器學(xué)習(xí)、信號(hào)處理、電子工程。他們甚至在金融危機(jī)期間開發(fā)了股票交易程序。畢業(yè)后,梁與兩位同學(xué)聯(lián)手創(chuàng)立了一家名為High-FlyerManagement的量化對(duì)沖基金。
雷:所以量化基金基本上是利用數(shù)學(xué)模型和統(tǒng)計(jì)分析來進(jìn)行股票交易。決策過程中不涉及人類。在巔峰時(shí)期,High-FlyerManagement管理著大約140億美元的資產(chǎn),所以這是一支相當(dāng)規(guī)模的基金。而且,在其最成功的運(yùn)營(yíng)時(shí)期,它為投資者提供的年化回報(bào)率平均達(dá)到35%。所以我認(rèn)為它的表現(xiàn)確實(shí)非常出色。
Ha:據(jù)前員工透露,High-Flyer的創(chuàng)業(yè)文化充滿極客氣息。該公司早期的招聘啟事宣稱吸引了來自谷歌和Facebook的頂尖人才,并表示他們正在尋找擁有“奇特才華”的數(shù)學(xué)和編程“極客”。
Rai:早期的招聘啟事也提到了謝爾頓,他是美國(guó)著名情景喜劇《生活大爆炸》中的主角,非常尷尬。
謝爾頓·庫(kù)珀:例如,我哭是因?yàn)閯e人很愚蠢,這讓我很難過。
雷:謝爾頓有一大批粉絲,而且他幽默風(fēng)趣,這并非刻意為之。所以,你知道,DeepSeek早期的整體文化就是圍繞著重現(xiàn)那種極客、書呆子文化。那里有免費(fèi)零食、撲克游戲之夜。每個(gè)人都穿著T恤和拖鞋。
哈:聽起來是個(gè)很棒的工作場(chǎng)所
雷:是的,那確實(shí)是一種非傳統(tǒng)的創(chuàng)業(yè)文化。與你可能在中國(guó)的大型科技公司(例如阿里巴巴和騰訊)看到的文化不同。
哈:梁是如何從量化金融轉(zhuǎn)型到人工智能并創(chuàng)建DeepSeek的?
雷:梁一直對(duì)機(jī)器學(xué)習(xí)和人工智能有著濃厚的興趣。幾個(gè)月后,OpenAI推出了ChatGPT,這個(gè)聊天機(jī)器人一夜之間風(fēng)靡全球。當(dāng)時(shí)是2023年春天,ChatGPT發(fā)布幾個(gè)月后,梁宣布成立DeepSeek。DeepSeek在其早期宣言中談到了摒棄平庸,應(yīng)對(duì)人工智能領(lǐng)域的重大挑戰(zhàn),當(dāng)然,最終的目標(biāo)是攻克通用人工智能。
哈:宣言還闡述了DeekSeek的雄心——將中國(guó)定位為尖端技術(shù)的領(lǐng)導(dǎo)者。
雷:你知道,梁小軍接受了兩次采訪,雖然這兩次采訪并不常見。在這兩次采訪中,他都談到要讓中國(guó)的人工智能生態(tài)系統(tǒng)走向世界前沿。你知道,中國(guó)一直被指責(zé)為模仿者。他希望人工智能中國(guó)能夠走一條不同的道路。
Ha:DeepSeek進(jìn)展很快。自2023年以來,它已經(jīng)發(fā)布了超過六個(gè)AI模型,并幫助開創(chuàng)了一種名為“稀疏性”的技術(shù),使這些模型能夠更高效地訓(xùn)練和運(yùn)行。開發(fā)人員開始注意到這一點(diǎn)。然后,在今年早些時(shí)候——
DavidGura:現(xiàn)在回到頭條新聞,DeepSeek正在震撼全球科技……
雷:他們發(fā)布推理模型R1時(shí),引發(fā)了行業(yè)巨變,并導(dǎo)致股市崩盤,市值達(dá)數(shù)萬億美元。從那時(shí)起,全世界才真正開始關(guān)注這位神秘的中國(guó)AI企業(yè)家。
Ha:那么Saritha,DeepSeek的R1模型有何突破性之處?
Rai:直到最近,人工智能行業(yè)一直在投入數(shù)十億美元來構(gòu)建用于訓(xùn)練模型的基礎(chǔ)設(shè)施、數(shù)據(jù)中心和圖形處理單元。但DeepSeek所做的是,它證明了其模型在某些基準(zhǔn)測(cè)試中可以匹敵甚至超越最新的OpenAI或Anthropic模型,而且所需的計(jì)算能力和資源都遠(yuǎn)遠(yuǎn)少于后者,正如DeepSeek所聲稱的那樣,其資金也遠(yuǎn)少于后者。
哈:梁和他的團(tuán)隊(duì)是如何實(shí)現(xiàn)真正的創(chuàng)新的——而且成本只是其中很小的一部分?DeepSeek的成功對(duì)中美之間的人工智能競(jìng)賽意味著什么?這些我們稍后再談。
哈:過去十年的大部分時(shí)間里,美國(guó)一直試圖限制中國(guó)獲取半導(dǎo)體。2022年及次年,緊張局勢(shì)達(dá)到頂峰,華盛頓針對(duì)北京實(shí)施了兩輪芯片出口管制。
JonErlichman:在拜登政府表示將加強(qiáng)對(duì)中國(guó)人工智能芯片出口的限制后,英偉達(dá)和半導(dǎo)體公司的股價(jià)今日暴跌,現(xiàn)在英偉達(dá)向彭博社表示......
哈:這限制了英偉達(dá)等美國(guó)公司的銷售,這些公司的尖端芯片被科技公司用來幫助訓(xùn)練他們的人工智能模型。此舉給中國(guó)的開發(fā)者帶來了重大挑戰(zhàn),但正如彭博社的薩里塔·拉伊所說,這也迫使他們想方設(shè)法解決問題。
Rai:需求永遠(yuǎn)是創(chuàng)新之母。這一點(diǎn)已被中國(guó)的人工智能開發(fā)者證明,盡管面臨出口限制,他們?nèi)匀粯?gòu)建了優(yōu)秀的模型,并與全球頂尖水平進(jìn)行了對(duì)標(biāo)。
哈:DeepSeek最具創(chuàng)新性的方法之一就是我們之前提到的稀疏性技術(shù)。
Rai:稀疏性指的是在不具備高端計(jì)算能力的情況下構(gòu)建模型。這意味著大型語言模型無需完全依賴其資源即可給出查詢答案。Liang和他的同事們嘗試將模型的專業(yè)知識(shí)分配到更小的專家組中,然后只利用那些需要用到的專家組。這樣做不僅提高了計(jì)算效率,也降低了成本。
哈:從根本上來說,你不是用整個(gè)大腦,而是只用大腦的某些部分來進(jìn)行計(jì)算嗎?
Rai:完全正確,Oanh。你知道,它不會(huì)完全調(diào)動(dòng)你大腦里的每個(gè)小灰細(xì)胞,而是只激活那些包含特定專業(yè)領(lǐng)域的神經(jīng)元或大腦小部分。然后利用這些神經(jīng)元或小部分來響應(yīng)查詢或回答特定問題,無論是命令還是編碼問題。
哈:稀疏性方面的突破給DeepSeek的競(jìng)爭(zhēng)對(duì)手留下了深刻的印象,但最終登上頭條的卻是其價(jià)格。DeepSeek表示,其V3模型的訓(xùn)練成本僅為560萬美元——遠(yuǎn)低于OpenAI在其最先進(jìn)版本的ChatGPT上花費(fèi)的約1億美元。
雷:現(xiàn)在肯定有很多人對(duì)這個(gè)數(shù)字持懷疑態(tài)度,因?yàn)閮H僅是基礎(chǔ)設(shè)施、模型訓(xùn)練、人才以及所需的時(shí)間,加起來就是一筆相當(dāng)可觀的資金。所以,這種懷疑是有道理的。人們估計(jì),如果沒有至少10億美元甚至更多的資金,DeepSeek根本不可能實(shí)現(xiàn)這個(gè)目標(biāo)。
哈:DeepSeek的另一個(gè)優(yōu)勢(shì)在于,像它這樣的人工智能初創(chuàng)公司在中國(guó)政府和國(guó)家主席習(xí)近平的領(lǐng)導(dǎo)下?lián)碛袌?jiān)定的盟友。薩里塔表示,習(xí)近平認(rèn)為生成式人工智能、機(jī)器人技術(shù)和其他高科技發(fā)展方向有利于國(guó)家議程,而這正是推動(dòng)關(guān)鍵技術(shù)自主化的宏偉計(jì)劃的一部分。DeepSeek的成功也促使阿里巴巴、騰訊和字節(jié)跳動(dòng)等規(guī)模更大的競(jìng)爭(zhēng)對(duì)手紛紛發(fā)布自己的人工智能模型。
Ha:Saritha,DeepSeek的模型目前已經(jīng)完全開源。這意味著任何個(gè)人或公司都可以將DeepSeek的算法整合到自己的程序中。為什么公司選擇這種方式?為什么這種方式很重要?
Rai:開源,從某種程度上來說,可以說是讓人工智能民主化,并將其推向世界。但我們不要忘記,如果中國(guó)的人工智能模型是專有模型,并且成本與OpenAI等西方公司相當(dāng),那么在全球范圍內(nèi),接受者會(huì)更少。通過降低成本并開源,中國(guó)讓世界各地的人們能夠快速了解??并開始使用模型,從而使它們?cè)谏虡I(yè)和人工智能生態(tài)系統(tǒng)中更快地被采用,從而超越OpenAI等公司。這意義重大。這不僅關(guān)乎模型的民主化,更是戰(zhàn)略性地確保你通過降低成本來?yè)魯「?jìng)爭(zhēng)對(duì)手,以便世界迅速采用它,并使其成為主流。
Ha:因此,微軟和亞馬遜都在其云服務(wù)中提供DeepSeek。DeepSeek的模型已被整合到Perplexity中,Perplexity是一款人工智能搜索引擎,同時(shí)還提供OpenAI和Anthropic的模型。
Rai:人工智能的發(fā)展速度確實(shí)令人擔(dān)憂,全世界都擔(dān)心所有的控制權(quán)都掌握在一兩家公司手中。我認(rèn)為這正是DeepSeek和其他公司試圖向世界傳遞的信息,即所有的控制權(quán)不能都掌握在一兩家公司手中,他們構(gòu)建的專有模型也應(yīng)該更加民主。因此,我認(rèn)為開源理念的重點(diǎn)在于降低風(fēng)險(xiǎn)、集中精力,并允許更多人利用更容易獲得的技術(shù)進(jìn)行構(gòu)建。
哈:在構(gòu)建人工智能時(shí),西方方法和中國(guó)方法之間是否也存在某種文化沖突或價(jià)值觀沖突?
雷:非常清楚,因?yàn)槿绻阌^察DeepSeek的早期模型,甚至是未經(jīng)調(diào)整或微調(diào)的模型,你會(huì)發(fā)現(xiàn)它們基本上都在中國(guó)的審查規(guī)則框架內(nèi)運(yùn)行。例如,你無法向它詢問有關(guān)臺(tái)灣或習(xí)近平的問題,它只會(huì)給出一個(gè)非常平淡的官方答案。然而,如果你使用同一個(gè)模型,并用其他數(shù)據(jù)對(duì)其進(jìn)行訓(xùn)練,使其在文化上適應(yīng)不同的地域,這就是DeepSeek早期學(xué)到的一點(diǎn):通過開源模型,并讓開發(fā)者和用戶有機(jī)會(huì)根據(jù)自己的文化背景進(jìn)行定制,DeepSeek可以更快地在全球范圍內(nèi)被采用,而不是控制大部分模型,并使其只能在世界各地提供對(duì)中國(guó)友好的答案。
哈:盡管一些人對(duì)中國(guó)在人工智能領(lǐng)域的創(chuàng)新表示贊賞,但美國(guó)許多人懷疑其成功背后隱藏著更黑暗的原因。美國(guó)眾議院委員會(huì)4月份發(fā)布的一份報(bào)告指控DeepSeek與中國(guó)政府之間存在“重大”聯(lián)系。報(bào)告得出結(jié)論,該公司非法竊取了OpenAI的數(shù)據(jù)。中國(guó)大使館否認(rèn)這些指控,稱其毫無根據(jù)。與此同時(shí),DeepSeek和梁尚未對(duì)眾議院的這份報(bào)告發(fā)表評(píng)論。
哈:薩麗莎,目前看來,在人工智能領(lǐng)域似乎存在著某種軍備競(jìng)賽,尤其是在美國(guó)和中國(guó)之間。
雷:這就像一場(chǎng)比賽,我認(rèn)為現(xiàn)在就斷言勝負(fù)還為時(shí)過早。我只能說,一年前,我不會(huì)認(rèn)為這是一場(chǎng)勢(shì)均力敵的比賽。這是一場(chǎng)馬拉松,但你必須以沖刺的速度前進(jìn)。我們真的才剛剛起步,無論哪個(gè)國(guó)家最終獲勝,都將獲得巨大的經(jīng)濟(jì)收益。因此,每個(gè)國(guó)家,尤其是美國(guó)和中國(guó),都不想在人工智能領(lǐng)域松懈。
Ha:您認(rèn)為DeepSeek目前面臨哪些挑戰(zhàn)?
雷:我認(rèn)為主要挑戰(zhàn)之一是下一步該做什么?他們能做什么來超越他們已經(jīng)做過的事情?但我認(rèn)為,對(duì)于DeepSeek來說,在其本土市場(chǎng)也面臨著競(jìng)爭(zhēng)。阿里巴巴、字節(jié)跳動(dòng)和騰訊等許多中國(guó)公司正在構(gòu)建超越DeepSeek上一個(gè)旗艦?zāi)P偷哪P?。因此,DeepSeek面臨著做得更好的壓力。但我認(rèn)為,將這些模型商業(yè)化也存在一個(gè)問題。像DeepSeek這樣的公司將如何盈利?DeepSeek是否想盈利,如果想盈利,又將如何盈利,目前尚無明確的答案。
本文“人工智能”來源:http://m.daogo5.com/shishi/6515.html,轉(zhuǎn)載必須保留網(wǎng)址。







