拆解ChatGPT圣诞礼包3亮点|OpenAI用12天直播说了什么故事?

OpenAI在年末一次性公布o1与o3两代模型,除此之外,为期12天的直播活动中,还有三大亮点!

OpenAI自美国时间12月4日起,连续12个工作日进行圣诞倒数直播,先是在首日就推出模型o1的正式版,最后一天又来个惊喜回马枪,公布最新一代模型o3与o3-mini。

拆解ChatGPT圣诞礼包3亮点

与o1相同,OpenAI最新的o3和o3-mini也是运用「思维链」(Chain of Thought,CoT)技术的推理模型,但效能又较o1显著提升。


o3模型效能又较o1显著提升。图/ OpenAI YouTube

在美国时间12月20日的直播中,OpenAI研究副总裁陈信翰(Mark Chen)展示o3模型的内部测试成果,例如在软体工程方面,o3准确度达到71.7%,比o1模型高出约23个百分点;o3也在程式竞赛平台Codeforces取得2,727分佳绩。除此之外,o3在回答数学及博士级科学问题上,也都有优于o1模型的表现。

特别的是,o3模型在致力于比较AI与人类智慧的ARC-AGI测试中,最高可以达到87.5%得分,「人类表现得分85%的情况下,就具比较价值,在这以上的分数是一个重要的里程碑。」

ARC Prize基金会主席凯拉特(Greg Kamradt)表示,这意味着新一代模型更加接近通用人工智慧(Artificial General Intelligence,AGI),能够学习与获得新技能。


o3模型在ARC-AGI测试中,最高可以达到87.5%得分。图/ OpenAI YouTube

此外,o3-mini支持低度、中等和高度运算模式,也就是说,使用者可以依照任务复杂程度,调整模型的运算和思考时间。

目前新模型还没正式上线,OpenAI执行长奥特曼(Sam Altman)表示,o3-mini预计在明年1月先推出,o3则会随后跟上。而在1月10日之前,o3-mini模型会先开放给资安领域研究人员申请使用,以协助测试模型安全。

2024年尾声,OpenAI用12天直播说了什么故事?

在o1模型正式发布之前,业界几度有声浪质疑,用更大规模算力、参数和资料量,换取更佳模型效能的缩放定律(Scaling Law)已经濒临极限。 OpenAI在年末一次性公布o1与o3两代模型,像是一扫悲观的阴霾,除此之外,为期12天的直播活动中,还有三大亮点:

亮点一:开发者友善的客制化功能

过去大型语言模型(LLM)面对高度产业知识的发挥效果褒贬不一,OpenAI新推出强化学习微调(Reinforcement Fine-Tuning,RFT)功能,提供开发者能以简单程式,建立为专业领域而生的客制化模型,像是法律、医疗、金融等领域的专业咨询都能受惠。

此外,OpenAI也开放o1模型的API,提供包含函数调用(Function calling)、结构化输出(Structured Outputs)、开发者讯息(Developer Messages)和视觉输入等功能。其中,开发者讯息能够指定模型要遵循的细部指令,例如定义语气和呈现风格。而最直观的应用,是使用者可以串连API,制作出有个人风格的聊天AI。

亮点二:AI辅助工作流程

今年,OpenAI陆续祭出协作式编辑工具Canvas,以及AI搜寻引擎SearchGPT。 Canvas让使用者在写作或编写程式时,可以邀请AI协助编辑、补充资料或进行设计建议;SearchGPT则将实时网页搜寻整合至ChatGPT中。

而新推出的「专案(Projects)」功能,同时整合了Canvas与SearchGPT,使用者能够依据不同作业需求,自定义工作空间。无论是基本的档案管理、多人协作,或是整合程式码与自订指令,都能在专案空间中实现。

亮点三:多模态AI工具落地

OpenAI在系列直播中,再度展现语言模型从文字拓展至声音和影像的趋势。现在透过线上版本或直接拨打电话,都能和ChatGPT用语音对话,ChatGPT Plus和ChatGPT Pro的订阅者还能开启视讯功能,让ChatGPT根据眼前实景互动。

OpenAI也正式发布AI影片生成模型Sora,可以透过文字、图片或影片创建新的影片内容。 Sora支持最高1080p的画质,以及长达20秒的影片生成,并且,使用者能够逐帧编辑影像内容。

直播第一天,OpenAI就推出一个月美金2,000元的ChatGPT Pro订阅方案。后续包含Sora在内的新功能,都为订阅者设计差异化方案,在在彰显OpenAI今年转向商业模式的策略决心。此外,OpenAI也积极将ChatGPT与Apple Intelligence、与其他应用程式进行整合,在年末让使用者感受到ChatGPT无所不在。

本文链接地址:https://www.wwsww.cn/hqfx/29709.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。