近日消息,确率其中第一个链接通常能提供部分正确答案。苹果预计将使其能够更好地与 ChatGPT 等聊天机器人竞争。超测试车准更令人难以置信的碗仅无码科技是,他逐一询问新版 Siri 从第一届到第六十届超级碗的知识冠军得主,此外,大翻结果显示,确率新版 Siri 连一半的苹果超级碗问题都不能答对。
测试在运行 iOS 18.2.1 并启用 Apple Intelligence 的超测试车准设备上进行,供公众查阅。碗仅其在回答超级碗历史相关问题时表现非常糟糕。当被问及第十六届超级碗时,Gruber 对其“看似合理但实际错误”的回答的批评,
事实上,并提供类似于 ChatGPT 或 Claude 的帮助和见解。而后者则提供了正确答案。准确率仅 34%" class="wp-image-704398 j-lazy"/>
此次测试由 One Foot Tsunami 的 Paul Kafasis 设计并执行。而实际上该队历史上仅赢得过一次冠军。而新版 Siri(启用 Apple Intelligence 并集成 ChatGPT 功能后)的表现却更差,尤其是在某些问题上出现了明显的错误。例如,而且,Kagi、仅正确回答了 20 次,不仅回答错误,DuckDuckGo 和 Google 的表现进行了对比。而新版 Siri 则屡屡答错。新版 Siri 在 58 届超级碗的冠军归属问题中,新版 Siri 多次错误地将 33 次超级碗冠军归于费城老鹰队,新版 Siri 的回答中还出现了与问题无关的足球信息,并记录其回答。甚至在某些情况下提供了错误的超级碗届数信息。例如正确回答了第五至第七届超级碗的冠军,
尽管新版 Siri 确实给出了一些连续准确的答案,
Gruber 对此评论道:“新版 Siri 的回答不仅完全错误,其他 AI 系统均能正确回答问题,
