GPT-4o是什么?怎么用?GPT 4o是免费的吗?有何优势?

OpenAI于5 月13 日(美国时间)公布了其最新的AI 模型「GPT-4o」,该模型可无缝处理文字、音讯和图像,速度比GPT-4 Turbo 快一倍,且成本还只有后者的一半。

据OpenAI 所述,GPT-4o 将在未来几周内向所有ChatGPT 用户开放,那么,它可以怎么用?是免费的吗?

OpenAI GPT-4o 是什么?

继推出AI 影片合成工具Sora后,OpenAI 于5 月13 日(周一)宣布了其最新的人工智能(AI) 模型——「GPT-4o」,据称,该模型将使ChatGPT更聪明且更易于使用。

GPT-4o 是OpenAI 公司一年多前推出的上一代GPT-4 型号的更新版本,根据该公司周一的演示,GPT-4o 将有效地将ChatGPT 转变为可以进行即时语音对话的数位个人助理。它还能够使用文字和「视觉」进行交互,这意味着它可以查看用户上传的萤幕截图、相片、文档或图表,并就它们进行对话。

OpenAI 技术长Mira Murati 还指出,ChatGPT 的更新版本还将具有记忆功能,这意味着它可以从先前与使用者的对话中学习,并且可以进行即时翻译。

Murati 表示,「这是我们第一次在易用性方面真正迈出一大步」,而「这种互动变得更加自然,也更加容易。」

在发表会尾声,Murati 还感谢了辉达(Nvidia)执行长黄仁勋(Jensen Huang)及其公司,正是辉达替OpenAI 提供了所需的、先进的图形处理器(GPU),才能「让今天发表会的功能展示成真。」

GPT 4o 有何优势?

OpenAI 执行长Sam Altman 指出,GPT-4o 更聪明,更快,且具原生多模能力。

GPT-4o 的[o] 代表的是omni,也就是全能的意思,该模型是向自然人机互动迈出的一步。它能够处理50 种不同的语言,可以输入文字、音讯和图像的组合,也可以输出文字、音讯和图像。

GPT 4o 可在最短232 毫秒、平均320 毫秒内响应语音输入,明显快于传统的GPT-4。据说它的响应速度与「对话中人类的反应时间」大致相同。

此外,GPT-4o 与GPT-4 Turbo 在英语和程式码文字方面的表现相匹配,并且还显著改进了非英语语言的文本。该API 的速度也更快,且价格便宜50%。与现有模型相比,它的性能更好,尤其是在视觉和音讯理解方面。并且在各种基准测试中,GPT 4o 优于竞争模型。

在另一项演示中,研究人员还则展示了GPT-4o 模型的即时语言翻译能力,进一步延伸至「听声翻译」,比如,测试人员分别以义大利文和英文说话,随后新模型就把双方交谈的内容翻译成各自的语言。

不只如此,GPT 4o 语音模式与现有模型的不同之处在于它可以理解音调、多个扬声器和背景噪音等内容。在OpenAi 提供的演示中,GPT-4o 不仅可以了解说话者的特征,还可以针对「变得更戏剧化」、「听起来更风趣」等语气指令做出反应。

比较特别的是,当使用GPT-4o 时,人类可随时打断机器人,且AI 也能透过识别人脸情绪来作出回应,这让GPT 4o 比起问答更像是在聊天。

GPT-4o 的安全与限制

在说明GPT-4o 的强大能力后,OpenAI 也强调它的安全性。

根据其整备度框架(Preparedness Framework)及人类评估,该新模型在网络安全、CBRN(化学、生物、放射及核能)威胁、诱骗(persuasion)能力及模型自主能力都在中度以下。

而广泛的外部评估有助于识别和减轻风险,特别是在音讯输出等新领域,这些领域将在安全措施到位的情况下逐步发布。

GPT-4o 怎么用?

GPT-4o 的功能正在逐步推出,文字和图像功能已整合到ChatGPT 中。也就是说,您无需下载其他应用程式,可直接在ChatGPT 中使用GPT-4o。

打开ChatGPT 聊天介面后,就会收到GPT-4o 可用通知,点击「立即试用」即可。

此外,如果您是ChatGPT Plus 用户,可在介面左上方可以直接切换GPT-4o 模型。

开发者可以在API中存取GPT-4o,以一半的价格享受更快的速度和更高的速率限制。

GPT-4o 是免费的吗?

为了履行其使命,OpenAI 将开放GPT 4o 给所有用户,包括ChatGPT 免费订阅者。

Murati 表示,OpenAI 将推出具有GPT-4o 功能的ChatGPT 桌面应用程式,为用户提供另一个与公司技术互动的平台。 GPT-4o 也将可供希望从OpenAI 的GPT 商店建立自己的自订聊天机器人的开发人员使用,该功能现在也可供非付费用户使用。

更新的技术和功能将在未来几个月内推出到ChatGPT。

尽管目前所有用户都可以使用GPT 4o,但免费ChatGPT 用户将与新的GPT-4o 模型进行有限次数的交互,然后该工具会自动恢复依赖旧的GPT-3.5 模型;付费Plus(20 美元)用户将可以使用比免费用户多5 倍的讯息。团队和企业用户则拥有更多存取权限。

OpenAI 市场竞争与合作伙伴

在新模型GPT-4o 发布之际,OpenAI 正力求在日益激烈的人工智能军备竞赛中保持领先地位。包括Google和Meta在内的竞争对手一直致力于建立日益强大的大型语言模型,为聊天机器人提供动力,并可用于将人工智能技术引入各种其他产品。

OpenAI 发表新产品的时间点,正值Google 年度I/O 开发者大会前一天,预计该公司将在会上宣布其Gemini AI 模型的更新。与新的GPT-4o 一样,Google 的Gemini也是多模式的,这意味着它可以解释和生成文字、图像和音讯。

OpenAI 的更新也是在苹果下个月的全球开发者大会上预计发布人工智能之前发布的,其中可能包括将人工智能融入下一个iPhone 或iOS 版本中的新方法。

同时,最新的GPT 版本可能对微软来说是一个福音,微软已经向OpenAI 投资了数十亿美元,将其人工智能技术嵌入微软自己的产品中。

总结

综上所述,OpenAI GPT-4o 改变了AI 模型与多模式输入互动的方式。透过无缝组合文字、图像和音频,GPT-4o 提供了更丰富、更具吸引力的用户体验。

本文链接地址:https://www.wwsww.cn/rgzn/25575.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。