新足迹

 找回密码
 注册

精华好帖回顾

· 北美行:北美生活一瞥 (2006-9-10) SuiYi · 爸爸菜谱 - “大兴”鱼头汤 (2008-11-21) patrickzhu
· 女汉子系列四:自己动手设计施工的farmhouse style可爱小厨房(付真人秀) (2020-11-20) 不是随便的虫虫 · ***项链***七年不痒 (2010-9-10) 槐花点点
Advertisement
Advertisement
查看: 835|回复: 34

OpenAI发布GPT-4.5模型,专注提升写作和编程能力 [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-2-28 10:20 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
彭博社:OpenAI发布GPT-4.5模型,专注提升写作和编程能力

OpenAI正在向部分用户推出备受期待的新款人工智能模型GPT-4.5的早期版本,这款产品曾在开发过程中遇到难题。

这家总部位于旧金山的AI初创公司周四在一篇博文中表示,GPT-4.5在理解并回应用户书面提示中的细微线索方面表现更好,尤其擅长对话,写作和编程。OpenAI还表示,与之前的软件相比,新模型“胡编乱造”的情况预计会更少。

一开始,OpenAI将GPT-4.5作为“研究预览版”提供给一小部分软件开发者和每月支付200美元的ChatGPT Pro订阅用户。

OpenAI计划收集这些首批用户的反馈,然后再向更广泛的用户群体开放。

OpenAI于2022年底推出ChatGPT,掀起了一场生成式AI热潮。

ChatGPT最早使用的是GPT-3.5模型,自那以后,OpenAI陆续推出了一系列功能更强大的系统,包括几款能模拟人类推理过程的模型。

不过,OpenAI现在面临更激烈的竞争,对手包括中国的DeepSeek,马斯克旗下的xAI,以及Anthropic,这几家公司最近都发布了新模型。

OpenAI研究副总裁赖德(Nick Ryder)告诉彭博社,他预计GPT-4.5的能力提升幅度,会和2023年初GPT-4问世时相比GPT-3.5的提升幅度相当。

不过,打造GPT-4.5并不轻松。

据彭博社此前报道,这款模型在OpenAI内部被称为“Orion”,去年未能达到公司设定的性能目标。

知情人士透露,去年夏末,Orion在回答一些它没有见过的编程问题时表现不佳。

OpenAI和其他开发者面临的一个共同难题是:如何找到新的,优质的训练数据,为开发更先进的AI系统提供养料

OpenAI依靠一种叫做“后训练”(post-training)的流程来提升模型表现,这个流程包括结合人类反馈来改善回答质量,并调整模型的交流风格。

此外,OpenAI还通过新的方法训练GPT-4.5,利用了训练GPT-4.0时用过的数据生成的“衍生数据”,这一点是OpenAI研究副总裁格莱斯(Mia Glaese)透露的。

GPT-4.5的发布,标志着OpenAI某个时代的终结。OpenAI首席执行官Sam Altman本月早些时候在X上发文说,GPT-4.5将是OpenAI最后一款不具备“额外计算能力”来思考问题后再作答的模型。

OpenAI已经在一些最新模型中采用这种“推理模式”,包括o1和o3。

未来,OpenAI将把GPT系列和o系列模型结合,打造新的AI系统,让系统能够自动判断需要花多长时间思考问题,然后再回答。Sam表示,这样做的目的是让用户体验更简单,不用再面对越来越复杂的模型选项。





来源:

https://www.bloomberg.com/news/a ... ?srnd=homepage-asia

By Rachel Metz
28 February 2025 at 7:00 am AEDT
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-2-28 10:21 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本文要点:

1. OpenAI发布GPT-4.5的早期版本,这款新模型主要提升写作,对话和编程能力,并减少胡编乱造的情况,目前仅限少数开发者和高级付费用户试用。

2. GPT-4.5的开发历程充满挑战,内部代号为“Orion”,去年未能达到预期性能标准,特别是在解决陌生编程问题时表现不佳。

3. OpenAI利用后训练结合人类反馈,并通过从GPT-4.0训练数据中提取衍生数据,逐步改进GPT-4.5,克服了高质量训练数据短缺的难题。

4. GPT-4.5也象征着OpenAI技术路线的重要转折点,未来OpenAI将把GPT与o系列模型合并,实现智能动态思考时间管理,让用户无需手动选择复杂的模型选项。
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-2-28 11:23 |显示全部楼层
此文章由 flip 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 flip 所有!转贴必须注明作者、出处和本声明,并保持内容完整
程序猿要玩儿完

发表于 2025-2-28 11:46 |显示全部楼层
此文章由 Blackburnian 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Blackburnian 所有!转贴必须注明作者、出处和本声明,并保持内容完整
flip 发表于 2025-2-28 11:23
程序猿要玩儿完

其实不会, 因为利用AI, 程序猿会变成超级程序猿

巴菲特说别人恐惧时我们要贪婪, 王健林告诉年轻人,光有梦想不够,还要勇敢,清华北大不如胆子大

发表于 2025-2-28 11:57 |显示全部楼层
此文章由 DDD888 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 DDD888 所有!转贴必须注明作者、出处和本声明,并保持内容完整
希望能在免費版本或者API 調用裏可以使用測試下,看看效果如何

我現在工資收入有限,個人已沒有付月費的預算了

发表于 2025-2-28 12:08 |显示全部楼层
此文章由 thenorthface 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 thenorthface 所有!转贴必须注明作者、出处和本声明,并保持内容完整
以后不知道怎么样,但是目前,AI让程序员非常爽,大大提高效率。

未来就真不知道了,不好说。
Advertisement
Advertisement

发表于 2025-2-28 12:12 |显示全部楼层
此文章由 DDD888 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 DDD888 所有!转贴必须注明作者、出处和本声明,并保持内容完整
DDD888 发表于 2025-2-28 11:57
希望能在免費版本或者API 調用裏可以使用測試下,看看效果如何

我現在工資收入有限,個人已沒有付月費的預 ...

https://community.openai.com/t/g ... -the-api/1131571/13

顯然OPENAI應該用自己的人工智能測試下自己的服務,404 ERROR

发表于 2025-2-28 12:13 |显示全部楼层
此文章由 future2521 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 future2521 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Deepseek马上出R2,

PK一下,估计ChatGPT 4.5还是要凉,得尽快拿出来5.0才行。

发表于 2025-2-28 12:14 来自手机 |显示全部楼层
此文章由 laoqiu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 laoqiu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
值得一试。我看马思克的那个有个专门code标签,不知道实际效果怎么样。

2012年度奖章获得者 2011年度奖章获得者

发表于 2025-2-28 12:27 |显示全部楼层
此文章由 交易人生 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 交易人生 所有!转贴必须注明作者、出处和本声明,并保持内容完整
试了一下马斯克的xAI/Grok也不错,推理能力比chatgpt强,今天拿了个澳洲市场上的presentation,有图有文字有报表,16页,让这3个ai做个总结,grok花了10几秒钟,deepseek也是秒出,chatgpt差不多有7分钟才做完,洋洋洒洒写了一堆,不像总结。openAi走了几个关键人物。
0  to 1

发表于 2025-2-28 12:55 |显示全部楼层
此文章由 Blackburnian 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Blackburnian 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 Blackburnian 于 2025-2-28 12:58 编辑

GPT o1已经非常强大。今天调试,扔入一些Class,然后扔原始数据,询问出错的地方,并在几秒钟内正确解决。此GPT4无法做到。
巴菲特说别人恐惧时我们要贪婪, 王健林告诉年轻人,光有梦想不够,还要勇敢,清华北大不如胆子大
Advertisement
Advertisement

发表于 2025-2-28 13:01 来自手机 |显示全部楼层
此文章由 dogyi 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dogyi 所有!转贴必须注明作者、出处和本声明,并保持内容完整
今天翻出三月前写的项目目标,看看面前的mvp,300k行代码,表示,这三个月付的300刀,挺值。

发表于 2025-2-28 13:02 |显示全部楼层
此文章由 对你爱不完 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 对你爱不完 所有!转贴必须注明作者、出处和本声明,并保持内容完整
flip 发表于 2025-2-28 10:23
程序猿要玩儿完

不会那么快,但是需求量肯定会逐渐萎缩

发表于 2025-2-28 13:16 |显示全部楼层
此文章由 Blackburnian 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Blackburnian 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 Blackburnian 于 2025-2-28 13:23 编辑
对你爱不完 发表于 2025-2-28 13:02
不会那么快,但是需求量肯定会逐渐萎缩

需求不一定会减少。在有AI之前,由于成本太高而无法启动许多项目。有AI之后,可以执行许多以前不可能的项目。如此一来反而需要更多会使用AI的程序猿。
巴菲特说别人恐惧时我们要贪婪, 王健林告诉年轻人,光有梦想不够,还要勇敢,清华北大不如胆子大

发表于 2025-2-28 13:39 |显示全部楼层
此文章由 粤式油鸡 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 粤式油鸡 所有!转贴必须注明作者、出处和本声明,并保持内容完整
升级来升级去还是只会写作和编程

AI什么时候能切鸡呀?

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-2-28 13:48 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
粤式油鸡 发表于 2025-2-28 13:39
升级来升级去还是只会写作和编程

AI什么时候能切鸡呀?

4.5 亮点概括如下:

知识更广泛:它学习了更多的信息,所以懂的东西比以前多

更少胡说八道:减少了「幻觉」(就是 AI 编造事实的情况)

更懂人心:「情商」更高,更能理解你的真实意图

对话更自然:聊天感觉更像和真人交流,不那么机械

创意更丰富:在写作和设计方面表现更好
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

发表于 2025-2-28 13:59 |显示全部楼层
此文章由 粤式油鸡 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 粤式油鸡 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-2-28 13:48
4.5 亮点概括如下:

知识更广泛:它学习了更多的信息,所以懂的东西比以前多
更懂人心:「情商」更高,更能理解你的真实意图


这个好!
智商二百五

发表于 2025-2-28 14:13 |显示全部楼层
此文章由 DDD888 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 DDD888 所有!转贴必须注明作者、出处和本声明,并保持内容完整


我试过了

这是我的问题
rust language generate code to get all file extension is .ts and return count

use std::{fs, path::Path};

pub fn get_ts_extension_file_count_from_folder(download_files_folder: &str) -> usize {

}

使用gpt-4.5-preview-2025-02-27

这是回答


use std::{fs, path::Path};

pub fn get_ts_extension_file_count_from_folder(download_files_folder: &str) -> usize {
    fs::read_dir(download_files_folder)
        .unwrap()
        .filter_map(|entry| entry.ok())
        .filter(|entry| {
            entry.path().extension().map_or(false, |ext| ext == "ts")
        })
        .count()
}



**Explanation:**

- `fs::read_dir` reads the directory entries.
- `filter_map(|entry| entry.ok())` filters out any errors.
- `filter` checks if the file has a `.ts` extension.
- `count()` returns the number of `.ts` files.
我不满意这回答,因为包含了.unwrap()

这是我的代码

use std::{fs, path::Path};

pub fn get_ts_extension_file_count_from_folder(download_files_folder: &str) -> usize {
    let path = Path::new(download_files_folder);
    if !path.exists() || !path.is_dir() {
        return 0;
    }

    fs::read_dir(path)
        .into_iter()
        .flatten()
        .flatten()
        .filter(|entry| {
            entry
                .path()
                .extension()
                .is_some_and(|ext| ext.eq_ignore_ascii_case("ts"))
        })
        .count()
}

2012年度奖章获得者 2011年度奖章获得者

发表于 2025-2-28 14:38 |显示全部楼层
此文章由 交易人生 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 交易人生 所有!转贴必须注明作者、出处和本声明,并保持内容完整
DDD888 发表于 2025-2-28 14:13
我试过了

这是我的问题

这是ds的code,grok不展示了(不太好)

use std::ffi::OsStr;
use walkdir::WalkDir;

fn main() {
    let root = std::env::args().nth(1).unwrap_or_else(|| ".".to_string());
    let mut count = 0;

    for entry in WalkDir::new(root)
        .into_iter()
        .filter_map(|e| e.ok())
        .filter(|e| e.file_type().is_file())
    {
        if entry.path().extension() == Some(OsStr::new("ts")) {
            count += 1;
        }
    }

    println!("Total .ts files: {}", count);
}
0  to 1

发表于 2025-2-28 14:40 |显示全部楼层
此文章由 DDD888 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 DDD888 所有!转贴必须注明作者、出处和本声明,并保持内容完整
交易人生 发表于 2025-2-28 14:38
这是ds的code,grok不展示了(不太好)

use std::ffi::OsStr;

你發的帖子,使用了變量count,顯然生成代碼不簡潔

发表于 2025-2-28 15:18 |显示全部楼层
此文章由 对你爱不完 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 对你爱不完 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Blackburnian 发表于 2025-2-28 12:16
需求不一定会减少。在有AI之前,由于成本太高而无法启动许多项目。有AI之后,可以执行许多以前不可能的项 ...

自动化程度越高,效率随之提高,需要的人自然减少,成本大幅降低

好比割麦子,过去20个人的活,机械化以后,可能两个人就搞定了,而且还快很多

这已经是过去式了,AI效率可远远高于这个例子,社会会转型的
Advertisement
Advertisement

发表于 2025-2-28 15:21 |显示全部楼层
此文章由 dtmr17 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dtmr17 所有!转贴必须注明作者、出处和本声明,并保持内容完整
thenorthface 发表于 2025-2-28 12:08
以后不知道怎么样,但是目前,AI让程序员非常爽,大大提高效率。

未来就真不知道了,不好说。 ...

哈哈,小点声,不要让老板或PM知道。

发表于 2025-2-28 15:21 |显示全部楼层
此文章由 fxdestiny1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 fxdestiny1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
贵出天际了,$75百万token,用这个写作不如直接找不要钱的大学生了

发表于 2025-2-28 15:27 |显示全部楼层
此文章由 对你爱不完 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 对你爱不完 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 对你爱不完 于 2025-2-28 14:29 编辑
DDD888 发表于 2025-2-28 13:40
你發的帖子,使用了變量count,顯然生成代碼不簡潔


这不是重点,同样一段代码,AI需要10秒,你需要多长时间去构思和运行?20分钟?应该都不止

如果把这个复杂程度增加一倍,AI肯定不需要20秒, 但是你需要的不止是40分钟

如果复杂程度是10倍那?AI还是不会超过1分钟的,你需要可远不止200分钟, 2000分钟你都搞不定

发表于 2025-2-28 15:28 来自手机 |显示全部楼层
此文章由 swe 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 swe 所有!转贴必须注明作者、出处和本声明,并保持内容完整
等养老机器人给我养老

发表于 2025-2-28 15:31 |显示全部楼层
此文章由 yzh1999 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yzh1999 所有!转贴必须注明作者、出处和本声明,并保持内容完整
交易人生 发表于 2025-2-28 12:27
试了一下马斯克的xAI/Grok也不错,推理能力比chatgpt强,今天拿了个澳洲市场上的presentation,有图有文字 ...

七分钟的应该是deep research吧。它的目标是生成有质量的学术报告,有详细的引用和论证,不太适合用来总结
Advertisement
Advertisement

发表于 2025-2-28 15:43 |显示全部楼层
此文章由 对你爱不完 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 对你爱不完 所有!转贴必须注明作者、出处和本声明,并保持内容完整
如果AI可以完全自己编程了,其实很多编程语言也无意义了,很多语言发明本来就是为了便于人类阅读,开发方便

机器都可以写程序了,干嘛不直接写机器语言?

2012年度奖章获得者 2011年度奖章获得者

发表于 2025-2-28 16:12 |显示全部楼层
此文章由 交易人生 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 交易人生 所有!转贴必须注明作者、出处和本声明,并保持内容完整
DDD888 发表于 2025-2-28 14:40
你發的帖子,使用了變量count,顯然生成代碼不簡潔

以我的理解,这段ds的code是支持递归的,recusive ,可能是用到counter 来looping directory和sub directory ,无限递归。不清楚你那个支不支持递归,看着chatgpt 的那版不太像支持递归的。

当然俺不懂rust,不是太看地清楚。
0  to 1

2012年度奖章获得者 2011年度奖章获得者

发表于 2025-2-28 16:13 |显示全部楼层
此文章由 交易人生 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 交易人生 所有!转贴必须注明作者、出处和本声明,并保持内容完整
yzh1999 发表于 2025-2-28 15:31
七分钟的应该是deep research吧。它的目标是生成有质量的学术报告,有详细的引用和论证,不太适合用来总 ...

是这样的,可能用chatgpt o1好点。o1 支持 CoT.
0  to 1

发表于 2025-2-28 16:18 |显示全部楼层
此文章由 DDD888 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 DDD888 所有!转贴必须注明作者、出处和本声明,并保持内容完整
交易人生 发表于 2025-2-28 16:12
以我的理解,这段ds的code是支持递归的,recusive ,可能是用到counter 来looping directory和sub direct ...

我是用crate walkdir 如果需要递归的话,可以降低我写的代码的复杂度https://crates.io/crates/walkdir

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部