OpenAI 于昨日 (25) 公告,其 AI 语言模型 ChatGPT 即将推出全新的语音及图像功能,用户将能透过语音对话,亲自向其描述自己的问题;另外也能上传并涂鸦图片,标记重点并帮助其了解自己所欲询问的问题。该功能将在未来两周内于付费版 Plus 及企业版上架。
OpenAI 推出语音及上传图片功能
OpenAI 宣布将把语音及图片搜寻功能加入其 AI 语言模型 ChatGPT,让原先仅基于文字对话的该产品,功能及互动性变得更加强大。
此举被视为是全球科技巨头之间有关「生成式 AI」战争的一部分,包括 Google 的聊天机器人 Bard 及 Apple 仍在开发中的 Apple GPT 等。
ChatGPT 说故事
首先,ChatGPT 结合了自家的 LLM (大型语言学习模型) 及语音对话助理技术,用户能与其进行简单的口头对话及询问问题,不必在忙碌时,还要打字向其询问,此举节省了时间并提升了生活效率。
新闻稿中举例,用户能口头要求 ChatGPT 编出一则睡前故事,并用一些声音提示来指导其描述,而 ChatGPT 也能透过用户所选择、高达五种不同的声音作回答。
OpenAI 补充:
这项全新的语音技术,将能从几秒内的人类声音中合成高仿度的拟真声音,为许多富有创意的应用程式敞开大门。
上传图片询问问题
接着在图像功能方面,用户将能透过拍摄并上传图片,要求 ChatGPT 解释它是什么、有什么功能或如何使用它。
此外,用户必要时也能涂鸦重点区域,以强调并帮助 ChatGPT 更贴近自己的问题。
新闻稿中也说道,ChatGPT 还能帮助用户检查脚踏车损坏的原因、查看冰箱食物来规划今日菜单、更甚至是分析工作上复杂的图表数据。
用户如何使用?
据悉,语音功能最初将仅在 ChatGPT 手机版的 Android 及 iOS 系统上推出,而图片搜寻将登陆所有平台。
用户将能前往应用程式中的「设定」选单,接着前往「新功能」并选择加入语音对话,即能开始使用。
上述功能将优先在未来两周内,于 Plus 及企业版等付费用户抢先推出,并将陆续提供给其他用户及开发者使用。
隐忧及风险
关于使用上的隐忧与风险,新闻稿中也提到,ChatGPT 本身能力仍有其局限性,呼吁用户不要使用该产品进行研究领域及专业技术上的应用。同时,也不要依循其指示,在未经完整验证的情况下,应用于高风险行为。
此外,针对语音功能,Open AI 则表示:
此举也带来了新的风险,包括犯罪者借此假扮或伪装成公众人物进行欺诈行为等。
不过,就在此前,GPT 3.5 及 4 等系列产品,都遭到一篇在各大社群平台流传的研究论文质疑,指出两产品的功能及品质在 6 月份的更新后便迅速下降,包括回复的精准性或正确度,用户对此纷纷表示有感。
本文链接地址:https://www.wwsww.cn/rgzn/21852.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。