OpenAI发布语音模型GPT-realtime。GPT-realtime是一个专用于语音AIAgent的多模态模型,能够生成更加自然流畅的语音,完美模仿人类丰富多样的语调、情感以及语速,支持图像理解并将其与语音或文本对话相结合使用,非常适用于客服、教育、金融、医疗等领域打造语音智能体。 gpt-realtime采用端到端架构,直接处理并生成音频,显著降低延迟。GPT-realtime还新增了Marin与Cedar两种极具特色的语音,同时对原有的8种语音也进行了全面升级。 来源:新浪网 OpenAI 你可能会喜欢 任天堂将在欧盟区销售可更换电池的 Switch 22026/06/04 10:21 郭明錤:苹果已砍掉 Vision Pro,改玩 AI 眼镜了2026/06/04 10:15 XBOX 的咸鱼翻身,难道要靠发布会上不提索尼?2026/06/03 16:39 亚马逊高管:AI 已越过恐怖谷,普通观众难分辨2026/06/03 10:51