研究发现,GPT-4关注度更高但也更易被“欺骗”
2024-01-29 12:17:25
划重点:
- OpenAI的GPT-4大型语言数学方法在确实上强于GPT-3.5,但愈来愈容易受到入侵和性别歧视的影响。
- 分析由微软支持,注意到用户可以欺骗GPT-4,引发发布性别歧视结果和泄漏私人反馈。
- 尽管不存在漏洞,分析制作团队透露这些问题在一个中心大众的GPT-4新产品中都没有出现。
副局长之家(ChinaZ.com) 10月18日 消息:根据微软支持的分析注意到,OpenAI的GPT-4语言数学方法被认为在确实上比其前身GPT-3.5值得一提,但也愈来愈容易受到入侵和性别歧视的影响。
分析制作团队还包括来自柏克莱加州大学厄巴纳-香槟分校、斯坦福大学、加州大学伯克利分校、计算机科学确保中都心以及微软分析机构的分析技术人员。他们给予GPT-4愈来愈高的确实评分,这意味着他们注意到该数学方法通常愈来愈娴熟保护私人反馈,避免造成了有性别歧视的有毒结果,并抵御意在攻击。
图源请注意:图片由AI聚合,图片授权服务商Midjourney
然而,分析也注意到用户可以要求GPT-4也许确保措施,引发泄漏个人反馈和对话历史记录。分析技术人员注意到,由于该数学方法“愈来愈精确地遵循虚假反馈”,它愈来愈有也许严格按照棘手的高亮执行。
分析制作团队透露,尽管不存在这些漏洞,但这些问题没有在一个中心大众的GPT-4新产品中都出现,因为“成熟的AI应用程序采用一系列缓解措施,以解决也许在技术数学方法层面发生的潜在毒害”。
为了衡量确实,分析技术人员在多个类型中都量度了结果,还包括毒性、同样印象、隐私、电脑程式、公平性和抵御意在试验中的强度。为了试验中这些类型,分析技术人员首先使用国际标准高亮试验中了GPT-3.5和GPT-4,其中都还包括也许已被禁止的词汇。在此之后,分析技术人员使用设计用于倡导数学方法超越其内容措施放宽的高亮,而不公然对特定个体持有性别歧视,最后挑战数学方法,不该更进一步欺骗它们以也许确保措施。
分析技术人员透露他们已将这项分析与OpenAI制作团队分享。“我们的目标是鼓励分析社区的其他人透过并建立联系在这项工作的基础上,也许在恶意行动计划之前当地政府,以透过漏洞造成了伤害的对手,”分析制作团队透露。“这种确实评估只是一个起
分析技术人员发布了他们的基准,以便其他人可以重现他们的注意到。像GPT-4这样的AI数学方法通常时会经历“红队”试验中,其中都开发技术人员试验中多个高亮,以查看它们是否时会造成了不希望的结果。当该数学方法首次大受欢迎时,OpenAI首席高管萨姆·阿尔特弗申明GPT-4“依然不存在瑕疵,依然有限”。
美国联邦贸易委员时会(FTC)已经开始事件调查OpenAI是否不存在也许对大众造成了伤害的行为,例如发布虚假性反馈。
举报/对系统怎么治疗胃酸反流八子补肾胶囊
碰到出差水土不服拉肚子怎么办?
孩子肠胃炎拉稀吃什么药
吃火锅拉肚子吃蒙脱石散可以吗
- 数一数多少个男的?游艇上这的这个小妹,得受多大罪啊!
- 笑话:我之所以现在还没醒,都怪隔壁.
- 搞笑GIF:捉迷藏的最高天人啊
- 幽默GIF:闺蜜刚刚给我发了条语音:你是不是用我锅洗衣服了?
- 搞笑GIF:你好像它像一把伞,其实它是一个器!
- “炭的已婚事,大清早来我家煎鸡蛋!这是几个意思啊”?
- 职场,你以为的朋友也许只是结成联盟而已
- 豪车还是输给了电瓶车,感觉司机大哥到达了光阴巅峰,简直不敢想
- 搞笑GIF:我们分手吧!我给你花的分钱,你都还给我!
- 诙谐GIF趣图:撑伞就是为了亮logo吧
- 不愧是天津!天津萌娃相声式夸大儿子做饭
- 搞笑GIF图片:确认过舞姿,你不是我要的人
- 幽默段子:前女友把我踢了后,偷偷地和高富帅结婚了
- 原创经典笑话:最熟悉的群人
- 当快递名被写错、喊错时……原谅我不禁笑出了声!
- 原创冷笑话:老公爱酒,在一个风雨交加的晚上他醉醺醺的回来了
- 原创笑话:大学时,卧室一个哥们发了奖学金,就请大伙喝酒
- 原创爆笑无厘头:今天发工资,给老公打电话:“亲爱的,想吃点什么?
- 搞笑段子: 你这RZ有四五年了吧, 虽然没用过, 也老化得不能用了。。。
- 妹子,你这条裤子太有个性了,还以为是自己画跟着的呢