开云真人·(中国)入口-kaiyun开云最新App下载-kaiyun开云官方网站梁文峰和他的团队大赚一笔-开云真人·(中国)入口-kaiyun开云最新App下载
你的位置:开云真人·(中国)入口-kaiyun开云最新App下载 > 新闻 > kaiyun开云官方网站梁文峰和他的团队大赚一笔-开云真人·(中国)入口-kaiyun开云最新App下载
kaiyun开云官方网站梁文峰和他的团队大赚一笔-开云真人·(中国)入口-kaiyun开云最新App下载
发布日期:2025-02-14 02:47    点击次数:134

kaiyun开云官方网站梁文峰和他的团队大赚一笔-开云真人·(中国)入口-kaiyun开云最新App下载

文 | 华商韬略,作 者丨张静波

文 | 华商韬略,作 者丨张静波

2024年冬天,杭州。

当西方还千里浸在圣诞节的狂欢中时,一位中国码农,站在庞杂的落地窗前,遥看着窗外的京杭大运河。

几分钟后,他作念了一件令硅谷战栗的事。

来自东方的精巧力量

“一种新的方式,让悉数这个词山谷都嗡嗡作响!”

好意思国CNBC电视台在报说念这件事对硅谷的影响时,这样评价说念。

12月26日,杭州一家名为“深度求索”的中国初创公司,发布了全新一代大模子:

DeepSeek-V3。

在多个基准测试中,DeepSeek-V3的性能均超过了其他开源模子,以至与顶尖的闭源大模子GPT-4o不相高低。

张开剩余89%

尤其在数学推理上,DeepSeek-V3更是遥遥当先。

令东说念主诧异的是,DeepSeek-V3在性能并列GPT-4o的同期,研发却只花了558万好意思元,覆按成本不到后者的二十分之一。

这让好意思国东说念主透澈坐不住了。

在此之前,谷歌和Open AI花了几年时候,耗资数亿以至数十亿好意思元,调用了几万块来源进的GPU,才干成相似的事情。

热烈的对比,让好意思国东说念主反想:大模子和算力,是否还值得投资?

好多硅谷大佬在纷纷点赞的同期,也体验到中国科技带来的苦涩:当好意思国东说念主休息时,他们在悉力追上咱们!

挑升旨真谛的是,这件事与中国空军六代机现身,确凿前后脚发生。

不少好意思国东说念主觉得,这比六代机更像上世纪50年代,苏联抢先辐射第一颗东说念主造卫星的斯普特尼克时刻。

有关词,确凿让好意思国硅谷感到轰动的,还不是DeepSeek-V3的高性能、低成本,而是中国东说念主展现出的独创精神。

中国AI公司往日确凿都在照搬硅谷,以致东说念主们渊博觉得:好意思国擅长从0到1的技巧突破,而中国只擅长从1到100的诈欺落地。

DeepSeek-V3蹂躏了这种成见,它以MLA、DeepSeekMoE等多项始创性技巧,大幅擢升了模子的性能和覆按后果。

好意思国东说念主诧异地发现,正本中国公司也不错行动改进孝敬者,在他们的游戏除外,自定游戏轨则。这在往日是极其陌生的。

因为进展太过优厚,DeepSeek在硅谷被誉为来自东方的精巧力量。

这股精巧的东方力量,令东说念主称奇的所在在于,它幕后的资方并不是腾讯、阿里这样的互联网巨头,而是一家低调的私募基金——幻方量化。

当今,国内领有万卡GPU的企业不越过5家,幻便捷是其中之一。

它在2023年确立子公司“深度求索”,开动DeepSeek大模子的研发,悉数这个词团队唯独139名成员,远少于OpenAI的1200东说念主。

执掌这支战队的,是一个叫梁文峰的80后,亦然幻方量化的创始东说念主。

当意思意思心驱动了豪恣

梁文峰和幻方的故事,始于2008年。

那一年,从浙大毕业、主修软件工程的他,莫得像同龄东说念主一样,参加大厂当码农,而是一个东说念主跑到成都,蜗居在出租屋里。

在那儿,梁文峰开动沟通用打算机赢利的各式路子。

几番折腾下来,他决定下场作念量化投资。但这个决定并抵制易,毕竟其时量化在国内照旧个新事物。

好多东说念主并不肯定,量化不错赢利。

每当困难时,梁文峰总会想起量化投资之父西蒙斯的一句话:一定有办法对价钱建模。

在这个信念撑抓下,梁文峰苦苦熬了两年,终于柳暗花明。2010年,沪深300股指期货推出,量化投资迎来了春天。

乘着这股东风,梁文峰和他的团队大赚一笔,自营资金越过5亿元。

也便是归并时期,跟着深度学习算法的突破,东说念主工智能大爆发。早年在浙大就沟通东说念主工智能的梁文峰,燃起雄雄斗志。

2015年,他和浙大学友,共同创立了幻方量化。

几个意气热潮的年青东说念主,试图用数学和东说念主工智能,在中国打造一个像文艺回话那样寰球顶级的量化对冲基金。

只是一年后,他们就上线了第一笔由AI驱动的实盘来去,并在随后,将悉数来去计策都AI化。

新技巧的加抓,让幻方量化旗下基金报恩率,远超同期沪深300指数。

这推动幻方量化基金领域抓续攀升,2021年一度超千亿元大关,位各国内量化四大天王之一。

有关词,基金领域推广的同期,梁文峰却靠近一个毒手问题。

AI来去计策需要算力支抓,尤其是,跟着模子参数的激增,对GPU算力的需求也在不休增长。

若何破解这一难题?梁文峰的遴荐是:堆算力!

从2019年开动,幻方量化大领域布局AI算力。

当年就投资2亿元,建成“萤火一号”AI算力集群,搭载1100块GPU算卡。而彼时的特斯拉,才刚刚提议Dojo超算主见。

几个月后,当英伟达发布最新A100芯顷刻,梁文峰再次抢跑,成为亚太地区第一批拿到此卡的东说念主。

紧接着2021年,他又投资10亿元,建成“萤火二号”,搭载1万A100算卡,算力特殊于76万台个东说念主电脑。

其占大地积,比10个篮球场还要大。

在AI大模子还莫得爆发的年代,梁文峰的举动,让好多东说念主感到豪恣。

一家私募基金囤这样多算力,究竟意欲何为?以至有媒体懊悔:幻方量化把A股散户吓坏了。

外界对幻方量化的遐想,还停留在本钱市集上。

但梁文峰的视力,早已望向星辰大海。

2017年,谷歌沟通团队在一篇始创性的论文中,初次提议Transformer架构。这是一种皆备基于驻扎力机制的神经累积,它颠覆了往日的传统算法。

一家叫OpenAI的好意思国初创公司,基于新架构不休覆按我方的大模子。最终在2022年以ChatGPT引爆AI大模子期间。

而后,人人互联网巨头,沿着OpenAI的路子激动,很少有东说念主质疑。

但一群初生牛犊的年青东说念主,在梁文峰的指导下,干了一件极其豪恣的事:他们试图校正Transformer架构。

事实上,从2023年创立深度求索,进军大模子的第一天起,梁文峰过火团队对算法框架的反想就开动了。

当别东说念主堕入浅薄师法OpenAI的惯性中时,这群年青东说念主不走寻常路。

他们冒着失败的风险,果敢尝试了MLA(多头潜在驻扎力机制)、DeepSeekMoE(夹杂人人模子)等多种始创性技巧。

几年前囤下的海量算力芯片,为他们的瞎想,插上了翅膀。

最终,这群年青东说念主创造了历史:DeepSeek-V3横空出世,今夜战栗了硅谷。

“中国不能能弥远陪伴”

对比中好意思科技产业,咱们时常赞佩:

中国为什么出不了像乔布斯、马斯克、黄仁勋一样伟大的企业家?

乔布斯生前唯唯一个宗旨:辞世,便是为了调动寰球。

黄仁勋早在后生时,就立下明志励志:要作念不一样的事,要透澈调动打算。

马斯克更是豪恣地喊出:要殖民火星,为东说念主类寻找第二家园。

比拟之下,中国企业家似乎把更多的视力,放在了赢利和生计上,很少昂首仰望星空,对改进的细心也不够。

事实上,往日30年,咱们还是习尚摩尔定律从天而下,躺在家里18个月就会出来更好的硬件和软件。

这使得咱们在一轮又一轮的IT波浪中,基本莫得参与到确凿的技巧改进里。

但这种步地,在近几年悄然调动,中国重生代企业家正以突破性改进,在西方的游戏除外别辟门户。

“中国也要迟缓成为改进孝敬者,而不是一直搭便车。”梁文峰暗示。

早在上大学时,梁文峰就详情:AI一定会调动寰球。毕业后,他在量化投资上,赚了豪阔多的钱。

这使得他,有豪阔的本钱,听从内心的声息,去作念我方可爱的事情,而不是滥觞比权量力得失。

DeepSeek创立之初,就迷惑了中枢服务:探索通用东说念主工智能的本色!

在中国AI界,还很少有企业敢提议如斯豪恣的宗旨。

于是,往日几年,当好多大模子厂商忙着抢用户,作念营业化变当前,梁文峰却苦哈哈搞起了看似不赢利的基础沟通。

“改进不皆备是营业驱动的,还需要意思意思心和创造欲。”他说。

在梁文峰看来,中国企业在往日被营业驱动的惯性管制了。他但愿DeepSeek能解脱这种管制。

这样的打算理念,在当下的中国企业界,显得有点离经叛说念。

也曾有不啻一位业内东说念主士暗示:

梁文峰是中国AI界特殊陌生的东说念主,他领有恐怖的学习才略,兼具强盛的infra工程和模子沟通才略,又能疏通资源。

在里面职工看来,梁文峰则皆备不像雇主,更像一个极客。

时于本日,他依旧持续着低调的立场,和公司其他沟通员一样,每天看论文,写代码,参与小组询查。

这个低调的大佬,就连选东说念主、用东说念主的表情也跟主流扞格难入。

当好多大模子公司热衷于去国外挖东说念主时,梁文峰却反治其身,坚抓从原土招东说念主,并放出豪言:

“寰球前50名顶尖东说念主才可能不在中国,但也许咱们能我方打造这样的东说念主。”

不仅莫得国外东说念主才,也莫得行业大佬。梁文峰更可爱莫得教育的年青东说念主,因为他们不受条条框框的管制。

在DeepSeek,选东说念主的步伐一直都是宠爱和意思意思心。

事实上,这家初创公司并非外界传言的,有一批深不能测的奇才,而都是一些毕业才几年的年青东说念主。

以至,好多是北大、清华等Top高校还没毕业的博四、博五实习生。

因为服务太前沿,这些年青东说念主在开展服务时,确凿莫得参考贵寓。但也恰是这种空缺,让他们勇于突破传统。

比如,DeepSeek-V3最贫苦的改进之一MLA架构,就来自一个年青东说念主的突发奇想。

DeepSeek里面,也莫得高低级单干。

沟通经过中,如若有想法,每个东说念主都不错拉东说念主询查,并随时调用公司覆按集群的卡,无需审批,不设上限。

这种看似松散的责罚表情,极大地疏通了悉数东说念主的意思意思心和创造欲,让DeepSeek-V3得以横空出世。

在梁文峰身上,咱们混沌看到了乔布斯、马斯克、黄仁勋的影子。

“中国AI不能能弥远处在陪伴的位置!”

“确凿的差距不是一年或两年,而是原创与师法之差。”

这两句从梁文峰口中喊出的话,不仅事关AI产业,亦然中国企业在陪伴、师法了西方几十年后,不得不面对的突破标的。

低落的果子都被摘完结,唯独勇于突破,武艺找到新的长进。

梁文峰并不孑然。

今天,从大疆无东说念主机汪滔,到宇树机器东说念主王兴兴……一大都重生代企业家,正将中国科技产业带向无东说念主区。

参考贵寓

[1]《揭秘DeepSeek:一个更极致的中国技巧祈望主义故事》暗涌Waves

[2]《豪恣的幻方:一家隐形AI巨头的大模子之路》暗涌Waveskaiyun开云官方网站

发布于:北京市

相关资讯