新足迹

 找回密码
 注册

精华好帖回顾

· 鸣鸣找工经历 (2004-12-10) luxixi · 参观澳洲霍顿设计中心 (2017-9-19) kevin_au
· 国庆日土著舞蹈表演 (2013-1-27) alextzj · 写给即将踏上澳洲土地的朋友们 (2)(谁设的文章长度限制,偶得贴好几次) (2004-12-20) spirit1
Advertisement
Advertisement
查看: 2201|回复: 51

小型中国AI初创公司DeepSeek震惊硅谷 [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 07:22 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
金融时报:小型中国AI初创公司DeepSeek震惊硅谷  

尽管美国试图阻止中国的高科技野心,对冲基金亿万富翁梁文锋(Liang Wenfeng)在有限的预算下成功构建了一个AI模型。

小型实验室突破性成果引发轰动  

本周,一家小型中国人工智能实验室发布了其尖端模型的技术细节,震惊了世界,也让其隐秘的创始人梁文峰成为民族英雄。他的成功挑战了美国阻止中国高科技发展的企图。  

DeepSeek由对冲基金经理梁文峰创立,本周一发布了其R1模型,并在一篇详细的论文中解释了如何在有限预算下构建一个大型语言模型。

这个模型能够自动学习和改进,无需人工监督。  

硅谷争论技术优势是否能保持  

美国公司如OpenAI和Google DeepMind率先在推理模型领域取得进展。推理模型是一项较新的AI研究领域,旨在使模型达到人类认知能力的水平。然而,尽管旧金山的OpenAI去年12月发布了其完整的o1模型,但并未公开其方法。  

DeepSeek的R1模型发布后,在硅谷引发了激烈的争论。人们质疑美国资源更丰富的AI公司如Meta和Anthropic,是否能维持其技术优势。  

梁文峰成民族骄傲  

与此同时,梁文峰在中国国内成为国家自豪的象征。

本周,他是唯一受邀参加与中国第二号领导人李强会面的一位AI领域领袖。会议强调企业家要“集中精力攻克关键核心技术”。  

非传统路径助力成功  

梁文峰的AI项目始于2021年。当时他经营量化交易基金High-Flyer,同时购买了数千块英伟达图形处理单元(GPU)。

业界人士起初认为这是一个亿万富翁的“业余爱好”。  

一位商业合作伙伴回忆道:“我们第一次见到他时,他看起来是个发型糟糕的书呆子,一直谈论要用一万个芯片建一个集群来训练模型。我们当时并未把他当回事。”  

梁文峰在AI领域的“局外人”身份反而成为了他的优势。

他在High-Flyer积累了利用AI和算法识别股市模式的财富,同时团队也精通使用英伟达芯片进行交易。

2023年,他正式创立DeepSeek,并宣布要开发人类水平的AI。  

芯片限制倒逼创新  

在美国禁止英伟达将最先进芯片出口到中国后,当地AI公司不得不创新利用有限的国内芯片算力。

而梁文峰的团队早已掌握了如何最大化芯片性能。  

DeepSeek的工程师擅长挖掘GPU的潜力,即使这些芯片不是最先进的

这使得DeepSeek成为一个专注于研究的强大竞争者。  

专注研究的模式  

DeepSeek并未接受外部融资,也未将其模型进行大规模商业化。北京的一位AI投资者将其形容为“像DeepMind早期的样子”,完全专注于研究与工程。  

梁文锋亲自参与DeepSeek的研究,他也用量化交易基金的收益为DeepSeek支付高薪。

与TikTok所有者字节跳动一样,DeepSeek以在中国为AI工程师提供最高薪酬而闻名,员工分布在杭州和北京的办公室。

他的团队汇集了来自北京大学,清华大学和北京航空航天大学的顶尖人才,而不是依赖海外专家。  

在去年接受国内媒体采访时,他表示他的核心团队“没有从海外归来的人。他们都是本土人才,我们必须自己培养顶尖人才。”

DeepSeek作为一家纯粹的中国大型语言模型公司,赢得了国内的赞誉。

这位商业伙伴说。“团队相信梁文锋的愿景:向世界展示中国人可以具有创造力,并从零开始构建一些东西。”

有限资源的成功训练  

DeepSeek声称,仅用2048块英伟达H800芯片和560万美元,便训练出了一个拥有6710亿参数的模型,而这只是OpenAI和Google开发类似规模模型成本的一小部分。  

加州大学伯克利分校的AI政策研究员Ritwik Gupta表示,DeepSeek最近的模型发布表明,“在AI能力方面没有护城河”。

他说,“第一个训练模型的人必须花费大量资源才能达到目标。但后来者可以以更低的成本和更快的速度达到同样的目标。”

Gupta补充说,中国在系统工程师方面的人才库比美国大得多,他们更了解如何充分利用计算资源,以更低的成本训练和运行模型。

未来挑战与竞争  

尽管DeepSeek用有限资源取得了令人印象深刻的成果,但业内人士认为,随着行业演变,其竞争力能否持续仍是未知数。  

High-Flyer的投资回报在2024年有所下降,一位接近梁文峰的人士表示,这是因为梁将大部分精力放在了DeepSeek上。而与此同时,美国竞争对手正在扩大下一代芯片集群的规模。  

本周,OpenAI宣布与日本软银(SoftBank)成立合资企业“Stargate”,计划投资至少一千亿美元用于AI基础设施。马斯克的xAI正在大规模扩展其Colossus超级计算机,以容纳超过一百万个GPU,以帮助训练其Grok AI模型。

尽管DeepSeek目前拥有中国最大的先进计算集群之一,但梁文峰的商业伙伴坦言:“现在资源足够,但未来可能会面临压力。”  





来源:

https://www.ft.com/content/747a7b11-dcba-4aa5-8d25-403f56216d7e

Eleanor Olcott in Beijing and Zijing Wu in Hong Kong January 24 2025

评分

参与人数 2积分 +5 收起 理由
ausina + 3 感谢分享
fgyzj + 2 感谢分享

查看全部评分

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 07:23 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本文要点:  

1. 中国AI初创公司DeepSeek发布了R1模型,引发全球关注,并推动了硅谷对AI技术优势的讨论。  

2. 创始人梁文峰通过量化交易经验和自主创新,在有限资源下打造出了尖端模型。  

3. DeepSeek团队擅长利用本地有限的GPU资源,这种技术优势让其在中美竞争中脱颖而出。  

4. DeepSeek坚持以研究为中心,没有进行大规模商业化,与DeepMind的早期发展类似。  

5. 梁文峰强调团队本土化,主要吸纳国内顶尖高校人才,而非依赖海外归国专家。  

6. DeepSeek利用有限资源成功训练出6710亿参数模型,仅耗资560万美元,显示出其创新能力。  

7. 美国竞争对手如OpenAI和xAI正在大规模扩展其计算资源,加剧了全球AI竞争压力。  

8. DeepSeek的未来能否保持竞争力仍是未知数,特别是在美国AI公司快速发展的背景下。  

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-1-27 08:00 |显示全部楼层
此文章由 Blackburnian 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Blackburnian 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-27 07:23
本文要点:  

1. 中国AI初创公司DeepSeek发布了R1模型,引发全球关注,并推动了硅谷对AI技术优势的讨论。  ...

GPT在两年前横空出世以来,发展速度令人惊叹。如今,中国的AI模型逐渐走出自己的新路径,展现出追赶甚至超越美国的潜力。这无疑会推动美国加大在AI领域的投资。在中美激烈竞争的推动下,AI技术的发展可能会进一步加速,也许再过2-3年,AGI(通用人工智能)就有望诞生。
巴菲特说别人恐惧时我们要贪婪, 王健林告诉年轻人,光有梦想不够,还要勇敢,清华北大不如胆子大
头像被屏蔽

禁止发言

发表于 2025-1-27 08:06 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
全球多个团队,宣布复现了R1的训练过程。

全球最大开源平台HuggingFace团队,今天官宣复刻DeepSeek R1所有的pipeline,随后会公布训练数据和训练脚本。

在Hugging Face中,R1下载量直接登顶,另外3个DeepSeek模型也榜上有名。

此外,UC伯克利、港科大的研究团队,也都宣布复现了DeepSeek R1的训练过程,而且只需30美元,就能见证模型自我反思的“啊哈时刻”!

港科大使用7B模型,大概在第44步的时候,模型出现了自我反思,也就是模型发现自己推导错了,并进行自我修正。

评分

参与人数 1积分 +2 收起 理由
空山鸟语 + 2 感谢分享

查看全部评分

发表于 2025-1-27 08:09 来自手机 |显示全部楼层
此文章由 粤式油鸡 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 粤式油鸡 所有!转贴必须注明作者、出处和本声明,并保持内容完整
寻思澳洲也能有什么东西能让世界震惊一下吗?

我能想到工会应该算一个了,地位高,且组织罢工涨薪的技巧很丰富

评分

参与人数 1积分 +2 收起 理由
春暖花开2020 + 2 你太有才了

查看全部评分

发表于 2025-1-27 08:10 |显示全部楼层
此文章由 swallow7 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 swallow7 所有!转贴必须注明作者、出处和本声明,并保持内容完整
六代机,人工智能,电磁弹射,空间站,登陆月球,研发团队都是土鳖,和当代海归没关系

评分

参与人数 1积分 +2 收起 理由
空山鸟语 + 2 我很赞同

查看全部评分

Advertisement
Advertisement
头像被屏蔽

铜靴族

发表于 2025-1-27 08:11 来自手机 |显示全部楼层
提示: 该帖被管理员或版主屏蔽
头像被屏蔽

禁止发言

发表于 2025-1-27 08:12 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
使用DS的Deep think(R1)模式,系统会显示非常人性化的推导过程,经常出现“wait, Wait",然后提出另一个思路或者推翻之前的结果重来,这帮完全本地培养的人才,也把英语玩的这么溜。

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 08:16 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
figtree1 发表于 2025-1-27 08:12
使用DS的Deep think(R1)模式,系统会显示非常人性化的推导过程,经常出现“wait, Wait",然后提出另一个思 ...

DeepSeek,它给了一个"aha moment",我的意思是,这模型会在思考到一半突然深度反思,然后说,“等等,这很蠢,我来修正一下。”

它实际上增强了缩放法则的规则。。。

很快,全球各大模型也会用DS这个方法了。

DS的开源很好,极大促进了LLM的研发。

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
头像被屏蔽

禁止发言

发表于 2025-1-27 08:19 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Blackburnian 发表于 2025-1-27 08:00
GPT在两年前横空出世以来,发展速度令人惊叹。如今,中国的AI模型逐渐走出自己的新路径,展现出追赶甚至 ...

个人认为这个时代不会有AGI,AI会很聪明,会大幅度提高工作效率,但不会达到人的综合智力水平。

这是基于计算机目前的理论基础,AI和计算器的底层原理一样,都是依靠半导体技术的提升,力大飞砖得出的结果。与人脑的生物功能相差甚远。
头像被屏蔽

禁止发言

发表于 2025-1-27 08:23 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-27 08:16
DeepSeek,它给了一个"aha moment",我的意思是,这模型会在思考到一半突然深度反思,然后说,“等等,这 ...

其实这正是利用了计算机性能的优势,可以不断的试错,全方位,无死角地试一遍也只是一瞬间。这是人脑无非做到的。
Advertisement
Advertisement

发表于 2025-1-27 08:24 |显示全部楼层
此文章由 pzh 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 pzh 所有!转贴必须注明作者、出处和本声明,并保持内容完整
粤式油鸡 发表于 2025-1-27 07:09
寻思澳洲也能有什么东西能让世界震惊一下吗?

我能想到工会应该算一个了,地位高,且组织罢工涨薪的技巧很 ...

澳洲工会和美国工会比简直是弱鸡。美国码头工会居然可以要求雇主不准引入自动化设备,还可以得到拜登支持。
头像被屏蔽

水晶靴族

发表于 2025-1-27 08:24 来自手机 |显示全部楼层
提示: 该帖被管理员或版主屏蔽

发表于 2025-1-27 08:39 来自手机 |显示全部楼层
此文章由 ralphk 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ralphk 所有!转贴必须注明作者、出处和本声明,并保持内容完整
厉害。

我们不禁要反思,为什么中国DeepSeek愿意分享非常先进的算法,而不是申请专利,关起门来设置壁垒,大嘴巴指责别人剽窃,和别人告来高去。一定要反思,深刻的反思。

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 08:41 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
大家有没有发现一个问题,这一波AI浪潮,没有啥巴拉特的事儿。

为啥呢?

按理说,巴拉特也有百万的理工/计算机人才啊。

评分

参与人数 1积分 +1 收起 理由
lqbzddx + 1 因为主要是中美两国的中国人在竞争.

查看全部评分

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 08:44 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
你们看,目前全球AI最顶尖的科学家/研发人员,绝大多数是白人,华人和犹太人。

为啥没有涌现大批的巴拉特顶尖AI研发大拿呢?

Advertisement
Advertisement

发表于 2025-1-27 08:44 来自手机 |显示全部楼层
此文章由 danielweng 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 danielweng 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-27 08:41
大家有没有发现一个问题,这一波AI浪潮,没有啥巴拉特的事儿。

为啥呢?

空气污染太严重了,头疼?
专业砸分三十年,求互砸!有砸必报!

发表于 2025-1-27 08:44 来自手机 |显示全部楼层
此文章由 shuobuzuji 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 shuobuzuji 所有!转贴必须注明作者、出处和本声明,并保持内容完整
作为著名媒体难道FT没去问几个著名问题验证下功效吗?

发表于 2025-1-27 08:47 来自手机 |显示全部楼层
此文章由 粤式油鸡 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 粤式油鸡 所有!转贴必须注明作者、出处和本声明,并保持内容完整
pzh 发表于 2025-1-27 08:24
澳洲工会和美国工会比简直是弱鸡。美国码头工会居然可以要求雇主不准引入自动化设备,还可以得到拜登支持 ...

看来澳洲工会还有很长的路要走
智商二百五

发表于 2025-1-27 08:48 |显示全部楼层
此文章由 persist 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 persist 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 persist 于 2025-1-27 08:49 编辑

区别还是有的:Deepseek vs ChatGPT



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-1-27 08:53 来自手机 |显示全部楼层
此文章由 yx.zhang 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yx.zhang 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-27 05:44
你们看,目前全球AI最顶尖的科学家/研发人员,绝大多数是白人,华人和犹太人。

为啥没有涌现大批的巴拉特 ...

他们可以坐在机器后面给你写答案

评分

参与人数 3积分 +8 收起 理由
shuobuzuji + 2 你太有才了
zxie8 + 3 你太有才了
dootbear + 3 你太有才了

查看全部评分

Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 08:55 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
据说, Meta的工程师们正在疯狂地研究 Deepseek,试图从中复制一切可能的东西。

管理层在担心如何证明生成式人工智能组织的高额成本是合理的。

当每个生成式人工智能组织的“领导”的薪水都比训练整个 Deepseek V3 的成本还要高时,他们该如何面对高层领导呢?而且Meta有很多这样的“领导”。



发表于 2025-1-27 08:55 来自手机 |显示全部楼层
此文章由 cutebaby 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 cutebaby 所有!转贴必须注明作者、出处和本声明,并保持内容完整
淡定

看看后续

发表于 2025-1-27 08:56 |显示全部楼层
此文章由 HolyHH 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 HolyHH 所有!转贴必须注明作者、出处和本声明,并保持内容完整
persist 发表于 2025-1-27 08:48
区别还是有的:Deepseek vs ChatGPT

马上要被第三代替换的Grok2都会这道题。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-1-27 09:00 |显示全部楼层
此文章由 adamfuzhou 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 adamfuzhou 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-27 08:41
大家有没有发现一个问题,这一波AI浪潮,没有啥巴拉特的事儿。

为啥呢?

巴拉特忙着阅兵,昨天实在无聊看了会直播,那雾霾,真怕炸鸡

评分

参与人数 1积分 +3 收起 理由
dootbear + 3 感谢分享

查看全部评分

发表于 2025-1-27 09:02 来自手机 |显示全部楼层
此文章由 Kdst494 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Kdst494 所有!转贴必须注明作者、出处和本声明,并保持内容完整
有没有chatgpt牛逼,拿出来给人用用就知道了
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 09:03 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
adamfuzhou 发表于 2025-1-27 09:00
巴拉特忙着阅兵,昨天实在无聊看了会直播,那雾霾,真怕炸鸡

根据历史的经验,一个新的技术革命到改变人类生活方式,需要经历:

投资养号,生产创造,居民消费。

这三个顺序阶段才刚刚开始。

中美现在是在前排。

巴拉特作为全球第一大人口国,再不追赶,就要被抛弃了。

评分

参与人数 1积分 +5 收起 理由
adamfuzhou + 5 我很赞同

查看全部评分

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-1-27 09:14 来自手机 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-27 08:41
大家有没有发现一个问题,这一波AI浪潮,没有啥巴拉特的事儿。

为啥呢?

中国已经成功建立了美国硅谷的机制,把资金 人才 市场有机结合起来,印度只有人才还是远远不够的。

发表于 2025-1-27 09:20 来自手机 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-27 09:03
根据历史的经验,一个新的技术革命到改变人类生活方式,需要经历:

投资养号,生产创造,居民消费。

这是表面的顺序,不是内在的机理。第一步的资金哪里来?西方是殖民掠夺,中国是压榨几亿农民。印度没法弄。

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 09:24 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
到目前为止,大家都认为,行业贡献而言:

GPT>deepseek>gemini>llama及其它



发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部