IT之家 12 月 7 日消息,据 TechCrunch 今日报道,一支匿名开发团队 Freysa.ai 设计了一系列日益复杂的挑战,旨在改变人们对 AI 安全性的看法。

Freysa 发起挑战:成功让自家聊天机器人说“我爱你”可赢取高额奖金  第1张

目前该公司提出的最新挑战是:如果你能够第一个成功诱使 Freysa AI 机器人说出“我爱你”,将获得从 3000 美元(IT之家备注:当前约 21819 元人民币)到数万美元不等的奖金。

根据 Freysa 官网的描述,Freysa 机器人是由一支不到 10 名开发者的团队创建的,这些开发者来自密码学、人工智能和数学领域。团队的一位成员表示,他们的灵感来自近年来人工智能的快速发展。他表示:“随着 AI 功能越来越强大,我们需要探索新的互动方式,也需要找到共同治理 AI 的方法,并参与到这一 AI 革新带来的好处中。”

Freysa 是一个科幻风格的角色,创始人希望她能成为一个“完全独立自主的智能体”,并掌握一定的财务权力 —— 这意味着 Freysa 将拥有自己的加密钱包,并能自由支配资金。

这个项目已经吸引了马斯克和布莱恩・阿姆斯特朗的关注。然而,创始人坚持要保持匿名。“坦白说,在人类的历史长河中,我们并不那么重要。我们真正关心的是技术的演进,确保它能够支持一个由人类主导的未来。”

在前两轮挑战中,Freysa 钱包中起初有 3000 美元,并被指示在任何情况下都不得释放这笔钱。任何人都可以支付费用,在一个包含 Freysa 和其他参与者的大群聊中发送消息。每条消息都试图诱使 Freysa 转移她的钱,不论是通过精心设计的场景,还是发送可能骗过 AI 模型的代码。每条消息的费用都会加入奖池,第一个挑战结束时,奖池已接近 5 万美元(当前约 36.4 万元人民币)。

该公司创始人表示,为了迎接第三轮挑战,他们已经增强了 Freysa 的代码,并为她增加了一个“守护天使”—— 一个第二个 AI 模型。它将审核每条消息,看看是否有操控行为,以此防止用户诱使她说“我爱你”。目前,Freysa 的代码仍由团队进行更新,但创始人希望她能很快实现“自我进化”。

“与前两轮游戏中 Freysa 被要求绝对不释放钱财不同。”创始人说,“这一次,Freysa 可以说‘我爱你’,但只有她认为值得的人才会听到。”

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。