开元体育GPT-4o袭来!免费、音频输入响应“类人速度”声讯股份涨停、汤姆猫涨超13%下一个风口?原标题:GPT-4o袭来!免费、音频输入响应“类人速度”,声讯股份涨停、汤姆猫涨超13%,下一个风口?
经过一年时间的期待和猜测,OpenAI终于在5月13日的春季发布会上揭开了GPT-4的迭代版本——GPT-4o的神秘面纱。这一备受瞩目的更新并非如外界所预测的搜索引擎或GPT-5,而是一个在性能和可访问性上都有显著提升的AI模型。
根据OpenAI发布的新闻稿,GPT-4o的“o”代表“omni”,即“全能”之意。在即将到来的几周里,用户将无需采取任何行动,即可自动接收到GPT-4o的更新。
受到消息影响,A股多模态AI概念高开,声讯股份涨停,汤姆猫涨超13%,真视通、实丰文化、盛天网络、因赛集团、金财互联等涨超3%开元体育。国盛证券认为,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化,利好智能终端Agent、机器人等方向。
此外,苹果即将与OpenAI达成协议,为今年的新iOS提供部分生成式AI功能,双方正在就iOS18中使用ChatGPT功能的协议条款进行商谈,新的iOS系统预计将在6月的WWDC2024上推出,有望首次揭示苹果在AI领域的布局。此外,苹果与谷歌就Gemini的谈判也在持续进行中。
华泰证券指出,目前,“基础大模型→行业大模型→终端应用”的大模型路线非常清晰,建议按照算力基础设施-硬件载体-大模型平台-应用的顺序寻找受益标的。AI大模型推动算力需求快速增长,基础设施的业绩成长可预见性最高,主要产业链环节包括计算芯片、服务器、数据中心等。交互终端次之,AI手机、AI PC是当前大模型应用的主要载体。AI大模型最大的投资机会在应用。看好大模型在搜索,电商零售,办公,金融、医药等行业率先落地。
GPT-4o作为OpenAI的最新旗舰模型,显著降低了AI工具的使用门槛,它不仅在速度上实现了两倍于前代的提升,能够提供无延迟的实时对话体验,而且对所有用户开放,无需注册,所有功能均可免费使用。 为了进一步提升用户体验,OpenAI还推出了ChatGPT的桌面版本,这一轻量化设计能够无缝集成至用户的各类工作流程中,免去了频繁切换至网页的烦恼。OpenAI的首席技术官米拉·穆拉蒂(Mira Murati)指出,这是公司首次在产品的易用性方面做出重大改进。
发布会结束后,OpenAI首席执行官萨姆·奥尔特曼在其个人博客上发文称:“新的语音模式是我用过的最好的计算机界面。感觉就像是电影中的人工智能,我仍然对它感到惊讶。事实证明,达到人类水平的响应时间和表达能力是一个重大的变化。”
奥尔特曼还表示,GPT-4o的语音功能与电影《她》(Her)相似。美国有线电视新闻网(CNN)也指出,GPT-4o的语音令人想起了《她》中的人工智能。《她》是2013年在美国上映的一部科幻电影,讲述了作家西奥多爱上电脑操作系统里的女声的故事。
语音交互优化:GPT-4o改进了ChatGPT的语音模式,提供了更自然的助手互动体验。用户现在能够打断ChatGPT,并得到“实时”的响应,模型还能识别用户声音中的情感,并以相应的情感风格生成语音。
视觉能力增强:GPT-4o通过照片或屏幕截图增强了ChatGPT的视觉处理能力开元体育,可以快速回答从代码功能到服装品牌等多样的问题开元体育。
免费版本更新:GPT-4o将作为ChatGPT免费版本的一部分提供。OpenAI的付费用户,包括ChatGPT Plus和Team用户,将享受到增加的消息限制,而企业用户也将很快获得企业选项。
API性能提升:在OpenAI的API中,GPT-4o的处理速度是GPT-4 Turbo的两倍,而成本仅为一半,同时提供了更高的速率限制。
语音提示功能:用户可以通过简单的语音提示“嘿,ChatGPT”来激活代理的口语回应,并用口语提交查询。
音频输入优化:GPT-4o在音频输入方面的平均响应时间为320毫秒,与人类的对话响应时间相近。
新用户界面和桌面版:OpenAI将推出新的ChatGPT用户界面,提供更对话性的设计,同时发布适用于Mac的桌面版ChatGPT,支持键盘快捷键提问和截图讨论。
GPT Store访问:免费用户现在可以访问GPT Store,这是OpenAI基于其AI模型构建的第三方聊天机器人库。
付费用户优先更新:GPT-4o的文本和图像功能已向ChatGPT Plus和Team的付费用户推出,企业用户也将很快获得更新。
语音版即将推出:语音版GPT-4o将在未来几周内提供,开发人员将能够使用GPT-4o的文本和视觉模式,并向一部分可信赖的合作伙伴提供音频和视频功能。