新足迹

 找回密码
 注册

精华好帖回顾

· 刚买了一个Subway,有没有悉尼开这个的tx相互联络一下 (2009-9-14) sinosword · 如何让宝宝听话---2岁宝宝经验分享 (2011-12-3) 小川妈
· 给大家拜年~~雪花家的年夜饭~~(做法已上) (2010-2-13) 紫雪花 · 梦竟成真 (2005-4-21) 清水胖头鱼
Advertisement
Advertisement
查看: 899|回复: 22

[中国大陆] DeepSeek的“顿悟时刻”带来打造强大AI的新方式,而且成本更低 [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-30 06:55 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
金融时报:DeepSeek的“顿悟时刻”带来打造强大AI的新方式,而且成本更低  

中国人工智能公司利用“强化学习”和“小型语言模型”取得突破。

中国AI实验室DeepSeek采用创新技术,开发出一种无需大量人工干预即可训练的AI模型,这一“顿悟时刻”可能会改变开发者利用该技术打造“杀手级”应用的成本。  

DeepSeek发布的研究论文详细介绍了其R1“推理”模型的运作方式,该团队由对冲基金亿万富翁梁文峰领导。

论文揭示,DeepSeek通过消除AI开发中的瓶颈,实现了显著突破。  

论文显示,DeepSeek采用了一系列更高效的技术来开发R1,这一模型与OpenAI的竞争对手o1类似,但不同之处在于,R1在生成回答时,会比大多数大型语言模型花费更多时间进行逐步“思考”,从而提供更准确的答案。  

DeepSeek的突破点在于利用“强化学习”,来减少人类在训练过程中对模型回答的干预。  

该公司还构建了参数较少但推理能力强的小型模型,参数指的是用于训练AI系统并决定其输出的变量。

DeepSeek的方法是对Meta和阿里巴巴等竞争对手训练出的大型模型进行优化,从而实现高效的AI推理能力。  

这些进展在硅谷引发震动,因为R1在某些任务上的表现优于OpenAI,Anthropic和Meta最近发布的模型,但其开发成本只是这些模型的一小部分。  

剑桥大学DeepMind机器学习教授劳伦斯(Neil Lawrence)表示,我认为,这仅仅是我们在这些模型上能期待的创新的冰山一角。

历史表明,大公司在规模化的过程中往往难以创新,我们看到许多大公司以计算资源投入取代了真正的智力挑战。”  

点赞触发“顿悟时刻(aha moment)”  

大型语言模型的训练通常分为两个阶段。第一阶段是“预训练”,开发者使用海量数据集,让模型学会预测句子的下一个词。

第二阶段是“后训练”,开发者进一步训练模型,使其学会遵循指令,例如解数学题或编写代码。  

让聊天机器人生成更实用回答的一种方法是“基于人类反馈的强化学习”(RLHF),这是OpenAI为改进ChatGPT所采用的技术。  

RLHF的原理是让人工标注员对AI模型生成的回答进行评分,并选择最佳答案。

这一过程通常耗时,昂贵,甚至需要庞大的数据标注团队。  

DeepSeek的重大创新在于自动化这一环节,采用了一种称为强化学习(RL)的技术,让AI模型在做出正确回答时获得奖励。  

DeepSeek首先开发了一个强大的文本预测模型V3,然后利用RL技术“奖励”该模型,例如对其生成的正确答案给予“点赞”。  

DeepSeek发现,经过多次这样的训练,该模型竟然能够在没有人为监督的情况下自发解决问题。  

这一技术也曾被谷歌DeepMind用于开发AlphaGo,这款AI系统在围棋比赛中击败人类选手,开启了近十年来深度学习计算技术的热潮。  

DeepSeek表示,R1在回答问题时会重新评估自己的答案,并调整计算时间,以适应不同类型的问题。这一现象被该公司称为“顿悟时刻”(aha moment)。  

DeepSeek团队在研究论文中写道,“‘顿悟时刻’强有力地提醒我们,强化学习有可能在人工智能系统中解锁新的智能水平,为未来更自主,更具适应性的模型铺平道路”。  

Hugging Face(AI研究公司)的研究员滕斯托尔(Lewis Tunstall)表示,让这一方法成功的关键似乎在于,首先要有一个极其强大的预训练模型,然后配备一套完善的基础设施,以大规模实施强化学习。

用大模型构建小模型  

在OpenAI和谷歌投入数十亿美元构建大型语言模型的同时,DeepSeek则采取了一种不同的方法,通过“蒸馏”大模型的推理能力,构建可以在手机或网页浏览器上运行的小型模型。  

DeepSeek使用R1模型生成了一个相对较小的数据集(80万条数据),然后利用这些AI生成的数据对阿里巴巴的通义千问(Qwen)和Meta的Llama等竞争对手模型进行优化。  

DeepSeek发现,这些经过蒸馏的小模型在推理能力测试中的表现尤为出色,甚至在某些情况下超越了Anthropic的旗舰模型Claude。  

滕斯托尔表示,“它几乎可以解出我本科时期学过的所有数学题。”。  

这一进展可能对应用开发者来说是一个利好消息,他们可以借助这种廉价高效的方法来构建产品。  

智库Rand的研究员海姆(Lennart Heim)指出,在AI模型生成答案的“推理”阶段训练其思维能力,比消耗大量计算资源进行预训练要高效得多。  

这一新范式可能使竞争对手以更少的计算资源和资金构建出具有竞争力的模型。

然而,海姆警告称,没有足够资金购买芯片,企业就无法大规模部署这些模型。  

DeepSeek尚未披露R1的具体开发成本,但表示R1基于V3模型,而V3的训练成本仅为560万美元。  

海姆补充道,不过,这一金额并不包括购买数千块图形处理单元(GPU)所需的费用,也未包含员工薪资,实验,训练和部署成本。  

尽管DeepSeek率先采用了这一独特技术,但预计其他AI实验室也将迅速跟进。

Hugging Face已经开始尝试复制R1的研究成果。  

美国AI公司也在探索如何将其大型,最先进模型的能力应用于更小,更灵活的模型。

谷歌去年推出了Gemma,这是基于其Gemini模型开发的一款轻量级模型。  

“Hugging Face的联合创始人兼首席科学官沃尔夫(Thomas Wolf)表示:“智能的秘诀其实很简单。”

他补充道,DeepSeek的技术已被业内广泛理解:

这就是为什么我预计很多团队都能重现这一成果。



来源:

https://www.ft.com/content/ea803121-196f-4c61-ab70-93b38043836e
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-30 06:56 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本文要点:  

1. DeepSeek 通过创新的强化学习方法,在减少人类干预的情况下训练AI模型,实现了显著突破,降低了AI开发成本。  

2. 该公司推出的R1“推理”模型采用逐步思考的方式生成答案,在部分任务上的表现超过OpenAI,Anthropic和Meta的模型。  

3. DeepSeek 的创新之处在于自动化“强化学习”过程,让AI模型通过“点赞”机制自发学习,类似于AlphaGo的训练方式。  

4. DeepSeek利用大型模型的推理能力,开发了可在手机或网页上运行的小型模型,这些模型在推理测试中表现优异。

5. 该公司声称仅用560万美元训练V3模型,但这一成本未包括GPU采购,人力成本等其他费用。  

6. 业界普遍认为,DeepSeek的技术路线具有很强的可复制性,预计未来会有更多AI公司采用类似的方法优化模型。
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-1-30 07:19 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
专业人士都认同DS的创新成果和巨大的成功。
即使是美国的反华政客也只能从国家安全角度,或者没有证据的知识产权方面去攻击。

评分

参与人数 1积分 +5 收起 理由
沧海一粟a + 5 感谢分享

查看全部评分

发表于 2025-1-30 09:17 |显示全部楼层
此文章由 kdssdk 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 kdssdk 所有!转贴必须注明作者、出处和本声明,并保持内容完整
DeepSeek Logo有点意思,鲸吞:像鲸鱼一样地吞食,多用来比喻侵吞土地,也表示食量异常的大。

发表于 2025-1-30 09:42 |显示全部楼层
此文章由 一司机 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 一司机 所有!转贴必须注明作者、出处和本声明,并保持内容完整
还是那句话,到底是大鲸鱼牛逼还是那些超级大公司用AI做幌子诈骗投资人?

评分

参与人数 1积分 +1 收起 理由
站直了 + 1 我很赞同

查看全部评分

发表于 2025-1-30 09:48 |显示全部楼层
此文章由 absd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 absd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
kdssdk 发表于 2025-1-30 09:17
DeepSeek Logo有点意思,鲸吞:像鲸鱼一样地吞食,多用来比喻侵吞土地,也表示食量异常的大。 ...

你这解读有点意思啊。。。

另外你的kds是宽带山吗?
Advertisement
Advertisement

发表于 2025-1-30 10:02 |显示全部楼层
此文章由 kdssdk 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 kdssdk 所有!转贴必须注明作者、出处和本声明,并保持内容完整
absd 发表于 2025-1-30 09:48
你这解读有点意思啊。。。

另外你的kds是宽带山吗?

哈哈
你的问题主要在于读书不多而想得太多。

发表于 2025-1-30 10:23 |显示全部楼层
此文章由 ninegumtrees 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ninegumtrees 所有!转贴必须注明作者、出处和本声明,并保持内容完整
美国是大力出奇迹,DS是另辟蹊径了,一台手机就可以搭个小型AI的环境,发展的真快。说不定AI很快就有自我意识了,西部世界就真的发生了。

发表于 2025-1-30 10:26 |显示全部楼层
此文章由 xq052b 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xq052b 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ninegumtrees 发表于 2025-1-30 10:23
美国是大力出奇迹,DS是另辟蹊径了,一台手机就可以搭个小型AI的环境,发展的真快。说不定AI很快就有自我意 ...

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
"Free speech is meaningless unless you allow people you don't like to say things you don't like. "

By Elon Musk

发表于 2025-1-30 11:00 来自手机 |显示全部楼层
此文章由 西门吹风 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 西门吹风 所有!转贴必须注明作者、出处和本声明,并保持内容完整
figtree1 发表于 2025-1-30 07:19
专业人士都认同DS的创新成果和巨大的成功。
即使是美国的反华政客也只能从国家安全角度,或者没有证据的知 ...

美国有反华政客吗?我以为只有反共政客哦。

你这移花接木的功夫不一般啊!

评分

参与人数 1积分 +3 收起 理由
laoqiu + 3 我很赞同

查看全部评分

发表于 2025-1-30 11:05 |显示全部楼层
此文章由 laoqiu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 laoqiu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
西门吹风 发表于 2025-1-30 11:00
美国有反华政客吗?我以为只有反共政客哦。

你这移花接木的功夫不一般啊! ...

所以有些爱华人士其实只是党的喉舌拥趸而已

评分

参与人数 1积分 +2 收起 理由
西门吹风 + 2 有共鸣

查看全部评分

Advertisement
Advertisement

发表于 2025-1-30 11:08 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整

这不也是智能表现吗?

发表于 2025-1-30 11:11 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 InTheEnd 于 2025-1-30 11:12 编辑
figtree1 发表于 2025-1-30 07:19
专业人士都认同DS的创新成果和巨大的成功。
即使是美国的反华政客也只能从国家安全角度,或者没有证据的知 ...


Microsoft今天将中国AI Company DeepSeek的R1车型带到其Azure AI Foundry平台和GitHub。 现在已成为Azure AI Foundry和Github上的模型目录的一部分- 允许Microsoft的客户将其集成到他们的AI申请。


从现在的消息看,我感觉DS基本靠谱,可能在英伟达的芯片上有夸大,但是模型大差不差

https://www.theverge.com/news/60 ... e-ai-foundry-github

发表于 2025-1-30 11:19 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
西门吹风 发表于 2025-1-30 11:00
美国有反华政客吗?我以为只有反共政客哦。

你这移花接木的功夫不一般啊! ...

那你要教育一下美国政客们,以后不要开口闭口“Chnia, Chinese”。

评分

参与人数 1积分 +2 收起 理由
花正红 + 2 我很赞同

查看全部评分

发表于 2025-1-30 11:24 |显示全部楼层
此文章由 liangyu42087 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 liangyu42087 所有!转贴必须注明作者、出处和本声明,并保持内容完整
对nvda估计没太大影响(虽然现在股票跌成狗)。。。

但是对open ai来说影响就大了,可以说直接摧毁了open ai 的business model。。。。。。说白了有免费的谁用你付费的东西啊。

可以说直接把Open AI的垄断给撕碎了。。。

发表于 2025-1-30 11:42 来自手机 |显示全部楼层
此文章由 西门吹风 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 西门吹风 所有!转贴必须注明作者、出处和本声明,并保持内容完整
figtree1 发表于 2025-1-30 11:19
那你要教育一下美国政客们,以后不要开口闭口“Chnia, Chinese”。


好像不需要教育美国政客,而是应该教育部分总是拎不清的人:

“ 美国与中国共产党战略竞争特设委员会(英语:Select Committee on the Strategic Competition Between the United States and the Chinese Communist Party)[2][3][4],是第118届美国国会众议院成立的一个委员会。该委员会将重点关注与中国共产党的经济和安全竞争。” ——wiki

http://selectcommitteeontheccp.house.gov/



Advertisement
Advertisement

发表于 2025-1-30 12:00 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 figtree1 于 2025-1-30 12:03 编辑
西门吹风 发表于 2025-1-30 11:42
好像不需要教育美国政客,而是应该教育部分总是拎不清的人:

“ 美国与中国共产党战略竞争特设委员会( ...


麻烦通知鲁比奥修改一下发言。
卢比奥将称中国通过欺骗手段跻身超级大国地位  

还有美国总统特朗普,人家基本都是说China。


https://www.oursteps.com.au/bbs/ ... extra=&mobile=1

发表于 2025-1-30 12:06 |显示全部楼层
此文章由 he275 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 he275 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 he275 于 2025-1-30 12:16 编辑

据说还有不少比DS更大的公司搞AI,譬如阿里巴巴那个AI。网上说,除了这些民间公司,中国政府和军方也有搞AI,好像更先进。


发表于 2025-1-30 12:07 |显示全部楼层
此文章由 站直了 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 站直了 所有!转贴必须注明作者、出处和本声明,并保持内容完整
一司机 发表于 2025-1-30 09:42
还是那句话,到底是大鲸鱼牛逼还是那些超级大公司用AI做幌子诈骗投资人? ...

这让我想起了戴比尔斯骗局,巨量的白钻储量却卖出天价,现在被中国的人造钻石要干趴下了。。。

发表于 2025-1-30 12:43 |显示全部楼层
此文章由 一司机 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 一司机 所有!转贴必须注明作者、出处和本声明,并保持内容完整
站直了 发表于 2025-1-30 11:07
这让我想起了戴比尔斯骗局,巨量的白钻储量却卖出天价,现在被中国的人造钻石要干趴下了。。。 ...

这万和亿单位的不同也太扯了,光靠说中国人民勤劳勇敢聪明也不可能这么大差距,怎么看都像那些大公司诈骗。
加分怎么加?加满啊!分用完了?加金币啊!没金币?买啊!

发表于 2025-1-30 12:45 |显示全部楼层
此文章由 happyheros 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 happyheros 所有!转贴必须注明作者、出处和本声明,并保持内容完整
钻石恒久远,一颗永流传
Advertisement
Advertisement

发表于 2025-1-30 20:34 来自手机 |显示全部楼层
此文章由 chcfy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 chcfy 所有!转贴必须注明作者、出处和本声明,并保持内容完整

老蕭曰
灰姑娘的馬車   已變回南瓜 .....


发表于 2025-1-30 21:10 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部