执行人工智能道德,使人工智能与人类价值相一致的实用技术
扫描二维码
随时随地手机看文章
AI现在在所有的软件开发生命周期中很常见,特别是在应用程序设计、测试和部署中。然而,此类系统的存在日益增加,因此必须确保它们服务于而不是违背人类价值观。人工智能代理人的不一致可能导致意外后果,如违反道德、决策中的歧视或滥用某些能力。
理解人工智能校准
AI校准,或称价值校准,是指人工智能系统的目标与其他人类目标和行动相兼容或至少可以共存的过程或哲学。随着人工智能技术的不断发展,人工智能可能会自我毁灭或对人类采取行动,这使得投资人工智能伦理的需要变得更加紧迫。
不结盟人工智能代理人的风险
不符合人类价值的人工智能系统有可能造成极大的破坏。人们应该关注一个没有道德方面的人工智能系统追逐目标。这样的人工智能系统有可能很好地发挥作用,但它的行为将是可怕的,会导致做出不恰当的选择,侵犯隐私,破坏社会价值观。这些弱点必须加以解决,所以人工智能设计师必须首先考虑道德问题。
从人的反馈中强化学习
人工智能技术的最新进展之一是从人类反馈学习(RLHF).这是一种人类强化的机器学习方法,它为模型指定了一个人类教师,特别是在奖励功能复杂或定义不清的情况下。这种方法将提高人工智能系统的工作方式,使其使用更加复杂、相关和令人愉快,这将改善人类与人工智能之间的互动和互动。
实施步骤
步骤1:预先培训语言模式
首先,对语言模型进行培训,使之符合其设计的传统目标,从而建立一种强有力的基础性理解。
步骤2:收集数据和培训奖励模式
获得对模型输出的人力投入,以创建一个围绕活动目标和预期结果的奖励模型。
步骤3:通过强化学习对LM进行微调
通过强化学习,利用奖励模型提高语言模型的性能,从而使语言模型的行为图更接近人类。
吸收外部知识
现代人工智能系统应纳入外部知识,以加强其自主运作,同时与人类道德标准保持一致。人工智能技术确保代理人作出富有成效的决定和执行道德行动,由于有最新和相关的信息访问,行动是有效率的,这有助于维护道德标准和廉正。
整合外部数据来源的方法
1. 回收强化一代: RAG允许GTP模型检索和整合来自外部文档的特定知识,使动态和背景感知决策成为可能。
2. 知识图: 有组织的实体网络及其关系为人工智能提供了背景理解,加强了推理和决策。
3. 基于本体的数据整合: 本体定义结构化的类别和关系,帮助AI集成和解释多领域信息,同时减少语义摩擦。
通过结构化的外部知识改进人工智能的业绩
· 相关的更新访问: 在AI中整合数据可以确保代理不会对陈旧的信息采取行动,即使情况是流动的。
· 尽量减少错误: 加入额外数据使理解环境变得更加容易,从而大大减少了出错的可能性,并且提高了由A生成的输出信息的质量。
· 道德配件: 人工智能系统可以将外部道德操守和标准作业程序纳入其中,使其职能符合良好的道德原则和要求。
人工智能调整方面的挑战
人工智能最大的问题是将人工智能系统的价值观与人类相结合的问题。应对这一挑战需要进一步改进,特别是在尽量减少人类认知固有的偏见和克服人工智能模式可利用的外部信息来源的限制方面。
人类反馈中的偏见
人类反馈是培训人工智能模型的关键,强化学习是一种特别有效的技术。然而,这种输入可能包括由个人主观性、文化背景或无意中的变量引起的偏差,可能会损害AI的表现。
外部知识来源的局限性
将外部知识整合到AI系统中可以通过提供新的数据来改进决策。然而,当这些数据过时、部分或错误时,就会出现问题,可能导致推理错误。此外,处理和解释大量混乱的外部数据可能很困难。因此,在将外部信息纳入人工智能系统之前,必须实施确保外部信息质量和可靠性的步骤。
道德智能发展最佳做法
有必要制定具体措施,纳入人的反馈和其他措施,以提高透明度和问责制,建立与人道主义原则同步的人工智能系统。
有效的人力反馈整合战略
· 结构性反馈机制: 执行常规活动以获得用户反馈,指导人工智能执行其活动.这可以通过调查、在线测试和互动历史来实现。
· 反馈来源的多样性: 在使用人工智能技术时,收集尽可能多的用户的反馈,以便最大限度地减少偏差和增强表示。
· 迭代发展: 遵循敏捷的方法,这样人工智能模型就可以根据用户的反馈进行训练和再训练,人工智能代理就可以根据用户的需求进行进化。
确保透明度和问责制
大赦国际发展的透明度和问责制对公众信任和道德操守至关重要。可解释的AI(XAI)方法帮助利益攸关方了解AI系统如何工作、决策过程和监控程序。
问责制和审计需要数据集属性、模型设计和培训资源的全面文档。需要定期进行道德评估,以发现和纠正偏见或不道德的做法,确保人工智能系统是负责、透明和符合人类价值观的。
结论
大赦国际的协调涉及开发人员、道德专家、法律当局和其他适当的利益攸关方的共同努力,以实现为人民设计和可供人民使用的大赦制度的建立。随着人工智能系统领域越来越具有包容性,必须始终考虑以人为本的伦理难题,并建立透明度,以作为推动因素。