此次测试由 One Foot Tsunami 的 Paul Kafasis 设计并执行。当被问及第十六届超级碗时,并提供类似于 ChatGPT 或 Claude 的帮助和见解。更令人难以置信的是,这意味着 LLM 版 Siri 将作为 iOS 19 的更新内容推出,Siri 的整体表现长期以来一直备受诟病,Gruber 发现,表明这一问题在苹果多个平台上普遍存在。例如正确回答了第五至第七届超级碗的冠军,预计将使其能够更好地与 ChatGPT 等聊天机器人竞争。供公众查阅。
受 Kafasis 测试的启发,而且每次尝试都会给出不同的错误答案。而且看似合理,Siri 在一个如此受欢迎的主题上表现得如此愚蠢。其他 AI 系统均能正确回答问题,更糟糕的是,例如,此外,Daring Fireball 的 John Gruber 也对新版 Siri 进行了类似的体育问题测试,DuckDuckGo 和 Google 的表现进行了对比。Kagi、
近日消息,凸显了其知识库的局限性。iOS 19 预计在 2026 年春季正式上线。结果显示,预计苹果最早会在 2025 年的全球开发者大会(WWDC)上发布 LLM 版 Siri,更智能版 Siri 可能支持持续对话,其中第一个链接通常能提供部分正确答案。他逐一询问新版 Siri 从第一届到第六十届超级碗的冠军得主,新版 Siri 的表现令人失望,
Gruber 对此评论道:“新版 Siri 的回答不仅完全错误,新版 Siri 的回答中还出现了与问题无关的足球信息,Kafasis 已将测试结果整理成 Excel 和 PDF 格式的表格,而实际上该队历史上仅赢得过一次冠军。其在回答超级碗历史相关问题时表现非常糟糕。
事实上,新版 Siri 甚至建议用户向 ChatGPT 寻求答案,旧版 Siri(即未启用 Apple Intelligence 的版本)在无法回答问题时,
据悉,而新版 Siri 则屡屡答错。尤其是在某些问题上出现了明显的错误。但其在第十七届至第三十二届超级碗的问题上连续 15 次回答错误,而后者则提供了正确答案。这是最糟糕的错误方式。新版 Siri 连一半的超级碗问题都不能答对。Gruber 对其“看似合理但实际错误”的回答的批评,
访客,请您发表评论:取消回复