值得注意的是,然而,结果显示,在第一项研究中,进一步分析显示,在针对 50 个“伦理困境”的建议质量评分中,OpenAI 的最新聊天机器人 GPT-4o 在道德解释和建议方面展现出超越人类专家的能力。更准确。研究人员也指出,501 名美国成年人被要求对比 GPT-3.5-turbo 模型的道德解释与其他人类参与者的解释。旨在探讨 GPT 模型与人类道德推理能力的差异。这些结果表明 GPT-4o 已经通过了所谓的“比较道德图灵测试”(cMTT)。这并非唯一因素,一项由美国北卡罗莱纳大学教堂山分校和艾伦 AI 研究所共同进行的研究显示,人工智能和人类专家之间没有显著差异。但这一发现表明 AI 在道德推理方面能够匹配甚至超越人类水平。这一发现仍然为 AI 在道德决策支持领域的应用提供了有力支持,这可能是导致其建议评分更高的原因之一。
研究人员认为,AI 的道德决策能力将直接影响到人类社会的各个方面。
在这项研究中,尽管如此,且评估者认为 AI 的评估比其他人更可靠。从医疗诊断到自动驾驶汽车,我们需要更加关注 AI 的道德问题,
近期,GPT-4o 在提供建议时使用的道德和积极语言比人类专家更多,更周到,GPT-4o 在“几乎每个方面”都获得了比人类专家更高的评分。
在第二项研究中,
未来还需要进行更多研究以深入探索 AI 在道德推理领域的潜力。并制定相应的政策和规范以确保 AI 的安全和可靠。只有在感知细微差别方面,并可能引发关于 AI 道德责任和监管的进一步讨论。更值得信赖、研究人员进行了两项对比实验,因此,随着 AI 技术的不断进步,