Ilya彻底离开OpenAI！超级对齐团队解散！Sam Altman，摆脱束缚，OpenAI从此一骑绝尘？还是ChatGPT未来堪忧？

Подписаться 54 тыс.

Просмотров 9 тыс.

50% 1

付费频道订阅： / @storytellerfan
Ilya彻底离开OpenAI！超级对齐团队解散！Sam Altman，摆脱束缚，OpenAI从此一骑绝尘？还是ChatGPT未来堪忧？
博客文章地址：lukefan.com/2024/05/21/ilya%e...
伊利尔在去年 11 月山姆奥特曼被董事会开除事件后，就逐渐淡出了公众视野，一直处于远程工作状态。最近，他终于正式离职，而他领导的超级对齐团队也随之解散，成员被打散到各个团队。超级对齐团队是 OpenAI 内部负责安全的团队，旨在确保模型输出符合人类价值观，但他们一直面临着算力不足以及与其他团队沟通不畅的问题。
OpenAI 的安全策略与其他公司不同，他们使用 "弱到强泛化" 的方法，用 GPT-2 训练的安全模型来监督 GPT-4。然而，随着 OpenAI 推出更多端到端的模型，如视频生成和语音到语音模型，这种方法变得越来越难以实施。
目前 OpenAI、Anthropic、Meta 和 Google 都采取了不同的安全策略，OpenAI 的超级对齐团队解散后，未来的产品发布可能会加速，但翻车概率也会增加。有人认为，"人类价值观" 本身缺乏明确标准，由公司来定义并不合适，或许政府或民间机构更适合进行监管。
伊利尔离开 OpenAI 后，可能会加入其他公司，如 XAI、英伟达、Meta 或亚马逊，也可能成立新的公司或非营利组织，继续致力于 AI 安全领域。OpenAI 在失去安全团队的制衡后，未来发展存在一定隐患，一旦产品造成巨大损失，后果不堪设想。
00:00:00 伊利尔彻底离开OpenAI，超级对齐团队解散
00:01:45 超级对齐团队的困境
00:03:19 超级对齐团队的人员流失
00:05:10 不同公司对 AI 安全的不同策略
00:06:39 OpenAI 的超级对齐方式
00:08:46 端到端模型带来的挑战
00:09:56 超级对齐团队的解散
00:13:01 超级对齐的价值
00:16:01 "人类价值观" 的标准问题
00:17:08 中国的 AI 监管方式
00:17:56 对未来的展望
00:19:21 伊利尔的未来
欢迎加入Discord讨论服务器：
/ discord

Опубликовано:

2 июн 2024

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист

Посмотреть позже

Комментарии : 61

@tycoonbig1776 13 дней назад

老范倾向集权了，政府不该审查生成式AI，应该由社会自我规范。

@karlshomekitchen 13 дней назад

你肯定社會自我規範可以確保對齊？lol

@tycoonbig1776 11 дней назад

@@karlshomekitchen 如果有问题，会有批评以纠正

@jefflee1261 13 дней назад

太搞笑了!自我审查习惯了，居然已经认为这种限制自由的自我审查挺好了!老范这个观点值得自我反省。标准就是普世价值，当然强国是不认的。

@rolling_cloud 13 дней назад

說到價值觀得先說人性，而立場大於事實是絕對人性中的人性，有些人能夠一定程度上壓抑這種想法，但這絕對是多數人的性格中佔主導地位的。所以當人性反映到算法上時，就會變成各種政治正確，事實不正確了，乃至於真正的歷史虛無主義了。而人們不想去面對這個事情時，就只能由開放者背鍋了。當然我自已也是多數人的一部分。

@karlshomekitchen 13 дней назад

我覺得人性包括在對自己關係不大的時候，多數人認爲應當努力做到立場不大於人性。例如陪審團，和自己強關係的案子應當回避。沒啥強關係的但是立場太强大的也要剔除。

@aotianlong 13 дней назад

超喜欢你的那张背景图，能有链接吗

@Duzehong 12 дней назад

应该是他自己电脑生成的

@StorytellerFan 12 дней назад

社区里面发过吧。

@paulzhu7694 13 дней назад

另外，老范，宪法AI的内容讲错了，实际上宪法AI是一个可迭代的用于微调大模型的小模型，A社专门介绍过一个实时迭代微调模型的技术，而claude大模型本身根本就是百无禁忌的学语料。而且Claude安全性是对普通人来说的，实际上claude目前仍然是越狱后几乎裸奔的模型，他们在对齐的资源投入上，远小于openai。安全性上，claude opus差于gpt4o的

@yxd00181 12 дней назад

有A社的链接吗？有没有比老范靠谱些的AI视频号？

@paulzhu7694 12 дней назад

@@yxd00181 更靠谱的都是github的AI开源工具大佬了，人家实际做开发和破解的，A社不就claude官网就是了

@StorytellerFan 12 дней назад

对Claude的使用并不多，我的宪法AI的内容，来自GPT4。

@Jersey1225 13 дней назад

看了奥特曼的很多訪談，感覺不像好人。。

@kpsesuo 13 дней назад

好人做坏事才真的是一往无前从道德高地向下冲锋

@burgermanwu1907 13 дней назад

幼稚

@Good-newss 13 дней назад

不是只有open ai一家，谷歌也有，只要市面上有勢均力敵的對手，就不用太擔心。

@curiosityark3525 13 дней назад

llya加入xAI成立AI安全组织是值得期待的，社交媒体最能帮助宣传超级对齐概念的影响力，也符合马斯克的立场。如果加入其他巨头成为打工人，和OpenAI老东家竞争没有意义，那样llya也失去了个人影响力和信誉。

@wangshuntian 13 дней назад

Ilya 是个好人

@StorytellerFan 12 дней назад

好人，未必不会办坏事。

@Guavaava 13 дней назад

超级对齐不是做价值观判断的吧？你说的那些不输出什么违反公序良俗的内容普通对齐就行，也是商业公司为了自己的商誉必须要做的。超级对齐我理解是为了防止以后的强力模型搞出危害人类社会的问题，而不是简简单单的所谓“政治正确”.

@karlshomekitchen 13 дней назад

你的理解基本正確。但是超級對齊未必能防止搞出危害人類社會的問題。超級對齊是說如何比人類更加善於駕馭和控制人工智能。

@paulzhu7694 13 дней назад

技术路线走错了，必死无疑，因为有竞争中，隔壁claude可能只花了gpt 1/10对齐资源就得到了不错的对齐效果，并且没有额外浪费资源去迭代AI内容审查，GPT4则无止境的低效迭代安全对齐，到最后GPT4笨的完全不想用，思维链活跃能力基本就是个推理机器了，而不是一个生动的ai。

@karlshomekitchen 13 дней назад

@@paulzhu7694 您真懂技術路綫？太好了，您要是真懂我想向你討教。如果只是汎汎而談，那我也理解。不過就不用浪費您時間了，我也會lol

@paulzhu7694 13 дней назад

@@karlshomekitchen 我只看到结果，AI宪法弄出来了claude 3 opus，超级对齐团队解散，但本身gpt4o的安全性比claude3 opus强的多，但为嘛解散了……openai对齐提示有大佬解析，大概每次对话你可能只有200token的一句话，它对齐过滤给你包了5000~8000token的提示词，还是system身份，这效率。Claude opus是根据黄标等级来的，默认只有几百个token对齐过滤，3级黄标时候，会上升到上千个过滤token，并且没有明确定义system身份，不会过多影响注意力权重，后来api打补丁给开了system身份，但注意力权重远没有openai的system那么高，毕竟主要的安全对齐是靠AI宪法模型的热微调机制，靠system提示打补丁是真的很低效，claude的技术对齐机制是开源工具Clewd作者推测的。

@Guavaava 13 дней назад

@@paulzhu7694 你去看llm elo，chatgpt 4还是领先claude的，4o更是断档式的领先其他所有llm，速度快答案还更好。目前openai没有发布更强新模型的原因不是他没搞出来，还是openai稳稳压其他厂商一头，根本不需要现在就把手里的牌都打了

@ryan.w9673 13 дней назад

突然想到，如果一个邪恶的公司/国家带头搞个专门用做坏事的 AI，是不是可以反过来倒逼这些其他的 AI 进步呢，就像博弈论里面的背叛和合作问题一样

@karlshomekitchen 13 дней назад

這種系統似乎不用搞，目前的系統基本都是。例如，如果我問，我如何改進自己，讓自己成爲領導呢？ChatGPT會回答，聼你的意思，你還不是領導？想當領導而卻沒當上領導，你大概率需要學習如何和領導搞好關係。你知道如何讓領導笑納你的禮物然後還更加器重你嗎？lol

@shenglitian-zf3ot 13 дней назад

不是如果，是一定，由于立场和价值观不同，一定有各种各样AI发展的方向，自缚手脚的肯定跑不快，比如谷歌

@Guavaava 12 дней назад

邪恶国家搞一个可能行，邪恶公司搞这个不太可能。因为这么搞不好挣钱，只能小打小闹，而训练一个好用的llm需要大量的资金。现实的例子可以参考推特被马斯克收购以后，阴谋论内容盛行，导致广告主不再在Twitter上投放广告、以及一些色情网站因为内容审查不利，有很多偷拍胁迫内容，使得Visa，mastercard，PayPal拒绝为这些网站提供支付服务。

@mengmeng4312 13 дней назад

左派右派都是有大部分双方都赞成的，争吵的都是不同的那部分。不要因为不认同你的想法就势不两立，争个你死我活。同样的，世界上很多人的观点各不同，同样要尊重客观事实。例如，type-c第一个使用的不是遥遥领先，就因为人多，就觉得是遥遥领先了吗。 ai系统不能因为，大多数认为，先有华为，后有天。就觉得真的现有华为后有天吧。超级对齐就是为了防止这种错误的输出吧

@paulzhu7694 13 дней назад

你想多了，GPT现在对齐最大的资源用来处理nsfw的内容……1年迭代了无数版本，把ai思维链活跃度搞的和智障一样了

@yicksunleung-we9eo 13 дней назад

革命要從娃娃抓起😂另外黑寡婦剛剛告了OPENAl

@milofu5611 13 дней назад

“踩一天缝纫机” 这个梗好硬！国内现在这么卷了吗？难怪政府要修更多的场地给人踩缝纫机用。

@karlshomekitchen 13 дней назад

唉，怎麽説呢？聊得聲情并茂，可惜有點望文生義。對齊的意思并不是那麽規範人類價值觀。沒有哪個小孩不是從小教好的。但是研究不好的小孩通常可以發現家長的教育能力其實在對齊方面相當短板 lol 大國的方法其實是一種粗暴對齊，結果不但不能對齊，（太）往往會發散到莫名其妙的方向去，還不如小孩。開辦食堂，大家都能平等不餓肚子，對齊不？很對齊啊，雖然目標不高。然并卵，一部分人就餓死了，或者說最終確實不餓肚子了。但是這是開辦食堂的本意嗎？這種對齊推薦給美國學？不怕美國真學坏了那可如何是好？小範的想法挺聰明，可惜沒辦法確保對齊。美國學會了就一票否決tiktok