OpenAI在7 月19 日推出了最新模型GPT-4o mini,从而取代旧的GPT-3.5。 GPT-4o mini 是OpenAI 新推出的高成本效益的小型AI 模型,用户仍可免费使用。而在本文中,我们将深入讨论中了解它的功能和能力。
GPT-4o Mini 功能介绍
两个多月前,OpenAI 发布了GPT-4o,这是其最新、最强大的AI 模型,该模型是第一个由该公司本地训练的模型,用于处理多模式输入和输出(文字、图像、音讯和最终视讯),而无需连结到其他模型寻求帮助。在发布之初,它是世界上第三方基准测试中最强大、公开可用的人工智慧模型,但几周后就被竞争对手Anthropic 的Claude 3.5 Sonnet 超越,此后两者一直不相上下。
但OpenAI 并没有就此止步,在今(7/19)日,它宣布推出该模型的更小版本GPT-4o mini,称其为「市场上最具成本效益的小型模型」。
OpenAI 表示,GPT-4o mini 在多项任务上表现优于GPT-3.5 Turbo,包括文本处理、多模态推理和数学编码能力。
1.推理任务
就涵盖文本和视觉的推理任务而言,GPT-4o mini 在MMLU 基准测试中以令人印象深刻的82.0%得分超越其他小型模型。这项文本智能和推理测试显示GPT-4o mini 优于Gemini Flash(77.9%)和Claude Haiku(73.8%)。
2.数学和编码能力
此外,GPT-4o mini 在数学推理和编码挑战方面表现卓越。
在评估数学推理的MGSM 基准测试中,GPT-4o mini 取得了惊人的87.0%,超越了Gemini Flash(75.5%)和Claude Haiku(71.7%)。同样地,在编码能力方面,GPT-4o mini 在HumanEval 上得分为87.2%,超过了Gemini Flash(71.5%)和Claude Haiku(75.9%)。
3.多模型推理
GPT-4o mini 的实力延伸至多模态推理。在MMMU 评估中,一个多模态推理基准,GPT-4o mini 实现了强劲的59.4%,超越了Gemini Flash (56.1%) 和Claude Haiku (50.2%)。
GPT-4o mini 供应情况和价格
GPT-4o mini 以其低成本和低延迟支援广泛的任务,例如连结或并行化多个模型调用(例如,调用多个API)、将大量上下文传递给模型(例如,完整的代码库或对话历史记录)或通过快速、即时的文本回应(例如,客户支援聊天机器人)与客户交互。
目前,GPT-4o mini 可在Assistant API、Chat Completions API 和Batch API 中作为文字和视觉模型使用。在价格方面,GPT-4o mini 每百万个输入token(约相当于一本标准书的2500 页)定价15 美分,每百万个输出token 定价60 美分,这比市场现有的模型便宜一个数量级,并且比GPT-3.5 Turbo 便宜60% 以上。 GPT-3.5 Turbo 是自GPT-4o 发布以来OpenAI 产品中最实惠的型号。
OpenAI 将GPT-4o mini 定位为GPT-3.5 Turbo 的直接后继者,但功能更强大,如上文所述,它还可以处理文字和视觉输入,而GPT-3.5 Turbo 只能处理文字。
对于ChatGPT 用户来说,GPT-4o mini 现在可用于免费、Plus 和Team 订阅,取代GPT-3.5。企业用户将在下周获得访问权限,符合该公司使AI 可及并对所有人有益的承诺。
GPT-4o Mini 将登陆苹果设备
OpenAI 产品、API 主管Olivier Godement 还表示,GPT-4o mini 将于今年秋天透过Apple Intelligence(苹果公司的新人工智慧服务)为其行动装置和Mac 桌面提供,时间与新iOS 18 软体的发布同时进行。苹果在上个月的WWDC 活动上宣布的合作伙伴关系的一部分。
然而,该模型仍将在OpenAI 云端伺服器上运行,而不是在设备上运行,这似乎首先否定了运行小型模型的优势之一,即本地推理本质上更快、更安全,并且不需要网路连接。
然而Godement 指出,即使连接到OpenAI 云端伺服器,GPT-4o mini 模型也比该公司提供的其他模型更快。此外,他告诉VentureBeat,大多数与OpenAI 合作的第三方开发者还没有兴趣在本地运行该公司的模型,因为这需要更密集的设定和运算硬体。
然而,GPT-4o mini 的推出提出了一种可能性,即OpenAI 开发者客户现在可以更经济有效地使用更少的硬体在本地运行该模型,因此Godement 表示,有一天这样的解决方案并非不可能提供。
GPT-4o Mini 的未来
如今,GPT-4o mini 在API 中支援文字和视觉,未来将支援文本、图像、视频和音讯输入和输出。该模型具有128K 个token 的上下文视窗,每个请求最多支援16K 个输出token ,并且具有截至2023 年10 月的知识。由于与GPT-4o 共用的改进分词器,处理非英语文本现在更具成本效益。
在今天快速发展的技术景观中,我们看到人工智慧智能惊人地激增,同时伴随着前所未有的成本降低。值得注意的是,具有卓越能力的人工智慧模型GPT-4o mini 的每个代币成本自2022 年前身模型text-davinci-003 推出以来已惊人地降低了99%。 OpenAI 坚定的承诺是在同时增强我们人工智慧模型的实力的同时,维持这种成本下降轨迹。
展望未来,该公司设想AI 模型将无缝嵌入每个应用程式和网站,增强用户体验并推动创新。 GPT-4o mini 是一个开拓者,让开发人员能够以前所未有的效率和成本效益来打造和扩展强大的AI 应用程式。 AI 的未来将变得更加易于接触、可靠,并成为我们日常数位生活的一个重要组成部分。
OpenAI 的新工具ChatGPT Enterprise
另外,OpenAI 于星期四(7/18)宣布了针对企业客户的新工具。在一篇部落格文章中,OpenAI 宣布了企业合规API,以帮助金融、医疗、法律服务和政府等高度规管行业的企业遵守日志记录和审计要求。
公司表示,这些工具将允许管理员对其ChatGPT Enterprise 数据进行审计并采取行动。该API 将提供时间戳互动的记录,包括对话、上传的文件、工作区用户等。
OpenAI 也为工作区GPT 提供更细致的控制,这是为特定业务使用案例创建的ChatGPT 的自定义版本。之前,管理员只能完全允许或阻止在其工作区中创建的GPT 操作,但现在,工作区所有者可以创建GPT 可与之互动的域名批准列表。
本文链接地址:https://www.wwsww.cn/rgzn/26626.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。