【SHS-026】芸能人、お貸しします。 番外SP 专治AI大模子对非常谜底“过于自信”,麻省理工学院提议新式高效低耗校准措施

发布日期:2024-07-31 20:42    点击次数:133

【SHS-026】芸能人、お貸しします。 番外SP 专治AI大模子对非常谜底“过于自信”,麻省理工学院提议新式高效低耗校准措施

麻省理工学院(MIT)和MIT-IBM Watson AI Lab的商议东说念主员提议了一种校准措施。

IT之家 7 月 31 日音讯,东说念主们正在越来越多地使用大模子完成各式任务【SHS-026】芸能人、お貸しします。 番外SP,不论是翻译、追思著作如故识别金融骗取,大模子齐是“兼容并蓄”。尽管这些模子齐具有“惊东说念主”智商,但它们偶尔也会生成非常谜底,并对非常谜底过于自信、对正确谜底信心不及,使用户对大模子是否值得信任暗意怀疑。

据 MIT NEWS 本日报说念,麻省理工学院(MIT)和 MIT-IBM Watson AI Lab 的商议东说念主员提议了一种专为大型说话模子量身定制的校准措施。他们的措施被称为“温度计”,其旨趣是在大说话模子之上构建一个较小的缓助模子来对其进行校准。

图源 Pexels

三月系列

图源 Pexels

据悉,这种被叫作“温度计”的措施所需的筹算智商更少,但同期又能保捏模子的准确性,并使其或然在未始遭受过的任务中作念出更好的校准响应。

通过针对各式任务对大说话模子进行高效校准,“温度计”不错匡助用户找出模子对非常展望过于自信的情况,最终详确用户在可能失败的情况下部署该模子。

联系论文的第一作家、麻省理工学院电子工程和筹算机科学商议生沈茂豪(IT之家注:音译)暗意,制服下的诱惑“咱们但愿向用户提供一个明确的信号,告诉他们模子的修起是准确如故不准确,以响应模子的省略情味,让他们知说念模子是否可靠。”

借助“温度计”,商议东说念主员成就出了一种多功能技能,愚弄一种被称为“温度缩放”的经典校准措施,为新任务有用地校准大说话模子。在此布景下,“温度”是一个缩放参数,用于调度模子的“信心”以与其展望准确性一致。

商议东说念主员历练了一个缓助模子,该模子在大型说话模子之上驱动,自动展望校准新任务所需的“温度”。“温度计”只需要考核大型说话模子里面的一个小部分,就能展望出特定任务数据点的正确“温度”,以校准其展望。

该团队但愿昔时使“温度计”复古更复杂的文本生成任务【SHS-026】芸能人、お貸しします。 番外SP,并将该技能应用于更大的大型说话模子。





Powered by 深夜激情网 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2022 版权所有