您当前的位置:首页 >> 家居资讯

研究发现,GPT-4关注度更高但也更易被“欺骗”

2024-01-29 12:17:25

划重点:

- OpenAI的GPT-4大型语言数学方法在确实上强于GPT-3.5,但愈来愈容易受到入侵和性别歧视的影响。

- 分析由微软支持,注意到用户可以欺骗GPT-4,引发发布性别歧视结果和泄漏私人反馈。

- 尽管不存在漏洞,分析制作团队透露这些问题在一个中心大众的GPT-4新产品中都没有出现。

副局长之家(ChinaZ.com) 10月18日 消息:根据微软支持的分析注意到,OpenAI的GPT-4语言数学方法被认为在确实上比其前身GPT-3.5值得一提,但也愈来愈容易受到入侵和性别歧视的影响。

分析制作团队还包括来自柏克莱加州大学厄巴纳-香槟分校、斯坦福大学、加州大学伯克利分校、计算机科学确保中都心以及微软分析机构的分析技术人员。他们给予GPT-4愈来愈高的确实评分,这意味着他们注意到该数学方法通常愈来愈娴熟保护私人反馈,避免造成了有性别歧视的有毒结果,并抵御意在攻击。

图源请注意:图片由AI聚合,图片授权服务商Midjourney

然而,分析也注意到用户可以要求GPT-4也许确保措施,引发泄漏个人反馈和对话历史记录。分析技术人员注意到,由于该数学方法“愈来愈精确地遵循虚假反馈”,它愈来愈有也许严格按照棘手的高亮执行。

分析制作团队透露,尽管不存在这些漏洞,但这些问题没有在一个中心大众的GPT-4新产品中都出现,因为“成熟的AI应用程序采用一系列缓解措施,以解决也许在技术数学方法层面发生的潜在毒害”。

为了衡量确实,分析技术人员在多个类型中都量度了结果,还包括毒性、同样印象、隐私、电脑程式、公平性和抵御意在试验中的强度。为了试验中这些类型,分析技术人员首先使用国际标准高亮试验中了GPT-3.5和GPT-4,其中都还包括也许已被禁止的词汇。在此之后,分析技术人员使用设计用于倡导数学方法超越其内容措施放宽的高亮,而不公然对特定个体持有性别歧视,最后挑战数学方法,不该更进一步欺骗它们以也许确保措施。

分析技术人员透露他们已将这项分析与OpenAI制作团队分享。“我们的目标是鼓励分析社区的其他人透过并建立联系在这项工作的基础上,也许在恶意行动计划之前当地政府,以透过漏洞造成了伤害的对手,”分析制作团队透露。“这种确实评估只是一个起

分析技术人员发布了他们的基准,以便其他人可以重现他们的注意到。像GPT-4这样的AI数学方法通常时会经历“红队”试验中,其中都开发技术人员试验中多个高亮,以查看它们是否时会造成了不希望的结果。当该数学方法首次大受欢迎时,OpenAI首席高管萨姆·阿尔特弗申明GPT-4“依然不存在瑕疵,依然有限”。

美国联邦贸易委员时会(FTC)已经开始事件调查OpenAI是否不存在也许对大众造成了伤害的行为,例如发布虚假性反馈。

举报/对系统怎么治疗胃酸反流
八子补肾胶囊
碰到出差水土不服拉肚子怎么办?
孩子肠胃炎拉稀吃什么药
吃火锅拉肚子吃蒙脱石散可以吗
相关阅读
友情链接