焦点热门:刚炮轰完GPT模式,杨立昆推出首个“世界模型”
智东西
编译 | ZeR0
(资料图片仅供参考)
编辑 | 漠影
智东西6月14日报道,今日凌晨,Meta宣布推出首个“类人(human-like)”AI模型 I-JEPA 。这是第一个基于Meta首席AI科学家杨立昆(Yann LeCun)愿景关键组成部分的AI模型,据称能比现有模型更准确地分析和完成未完成的图像。
在上周举办的背景智源大会上,杨立昆在发表致辞演讲时斗志昂扬地驳斥了GPT的逻辑,说自回归模型没有规划、推理的能力,单纯根据概率生成自回归的大语言模型从本质上根本解决不了幻觉、错误的问题,并给出了他认为的正确答案—— 世界模型 。
杨立昆去年提出了一种新的架构,旨在克服当今最先进的AI系统的关键限制。他的愿景是创造出能够学习世界如何运作的内部模型的机器,这样它们就可以更快地学习,计划如何完成复杂的任务,并随时适应不熟悉的情况。
基于LeCun愿景关键组成部分,今日发布的 图像联合嵌入预测架构(I-JEPA) 通过创建外部世界的内部模型来学习,该模型比较图像的抽象表示(而不是比较像素本身)。
I-JEPA在多个计算机视觉任务上提供了强大的性能,并且比其他广泛使用的计算机视觉模型的计算效率高得多。I-JEPA学习的表示也可以用于许多不同的应用程序,而不需要进行大量的微调。
例如,Meta研究人员在72小时内使用16个A100 GPU训练了一个拥有6.32亿个参数的视觉Transformer模型,并且它在ImageNet上实现了最先进的少样本分类性能,每个类只有12个标记示例,其他方法通常需要2到10倍以上的GPU时,并在使用相同数量的数据进行训练时获得更低的错误率。
I-JEPA相关论文将在下周的CVPR 2023上发表,训练代码和模型检查点的源代码已开放。
论文地址:https://arxiv.org/pdf/2301.08243.pdf
项目地址:https://github.com/facebookresearch/ijepa
Meta AI博客文章全文编译如下:
一、通过自监督学习获取常识性知识
Meta在I-JEPA(以及更普遍的联合嵌入预测架构(JEPA)模型)上的工作基于这样一个事实:人类通过被动地观察世界来学习大量关于世界的背景知识。
据推测,这种常识性信息是实现智能行为的关键,例如样本高效获取新概念、基础和计划。
AI研究人员试图设计学习算法,捕捉有关世界的常识背景知识,然后将其编码为算法以后可以访问的数字表示。
为了提高效率,系统必须以自监督的方式学习这些表征——也就是说,直接从图像或声音等未标记的数据中学习,而不是从人工组装的标记数据集中学习。
在较高的层次上,JEPA旨在通过相同输入的其他部分的表示来预测输入部分(如图像或文本)的表示。因为它不涉及将图像的多个视图/增强表示折叠到单个点,所以希望JEPA能够避免与另一种广泛使用的称为基于不变性的预训练的方法相关的偏差和问题。
与此同时,通过在高抽象水平上预测表征,而不是直接预测像素值,Meta希望直接学习有用的表征,同时避免生成方法的局限性,这是大型语言模型的基础,最近已经产生了如此多令人兴奋的进展。
相比之下,生成式架构通过删除或扭曲模型输入的部分来学习,例如删除照片的一部分或隐藏文本段落中的一些单词。然后,他们尝试预测损坏或丢失的像素或单词。
然而,生成式AI方法的一个显著缺点是,模型试图填补每一点缺失的信息,即使世界本身是不可预测的。因此,生成式AI方法可能容易犯一些人们永远不会犯的错误,因为它们过于关注不相关的细节,而不是捕捉高层次的可预测概念,例如生成式AI模型很难准确地生成人手。(他们经常会添加额外的数字或犯其他明显的错误。)
自监督学习的通用架构,其中系统学习捕捉其输入之间的关系。目标是为不兼容的输入分配一个高能量,并为兼容的输入分配一个低能量。(a) 联合嵌入(不变)体系结构学习为兼容输入x、y输出相似嵌入,为不兼容输入输出不同嵌入。(b) 生成式架构学习从兼容信号x直接重构信号y,使用以附加(可能是潜在的)变量z为条件的解码器网络来促进重构。(c) 联合嵌入预测架构学习从兼容信号x中预测信号y的嵌入,使用以附加(可能是潜在的)变量z为条件的预测网络来促进预测。
二、迈向具有广泛功能的联合嵌入预测架构的第一步
I-JEPA背后的想法是用一种更接近于人们一般理解的抽象表示来预测缺失的信息。
与在像素/标记空间进行预测的生成方法相比,I-JEPA使用抽象的预测目标,可以消除不必要的像素级细节,从而使模型学习更多的语义特征。引导I-JEPA生成语义表示的另一个核心设计选择是提出的多块屏蔽策略。
具体来说,Meta研究人员证明了使用信息(空间分布)上下文预测包含语义信息(具有足够大的规模)的大型块的重要性。
I-JEPA使用单个上下文块来预测来自同一图像的各种目标块的表示。上下文编码器是一个视觉Transformer(ViT),它只处理可见的上下文补丁。预测器是一个狭窄的ViT,它接受上下文编码器的输出,并根据目标的位置标记(以颜色显示)来预测目标块在特定位置的表示。目标表示对应于目标编码器的输出,其权重通过上下文编码器权重的指数移动平均值在每次迭代中更新。
I-JEPA中的预测器可以看作是一个原始的(受限制的)世界模型,它能够从部分可观察的环境中对静态图像中的空间不确定性进行建模。更重要的是,这个世界模型是语义的,因为它预测图像中未见区域的高级信息,而不是像素级的细节。
说明了预测器是如何学习对世界的语义建模的。对于每个图像,蓝色框外的部分被编码并作为上下文提供给预测器。预测器输出它在蓝色框内的区域中所期望的表示。为了可视化预测,我们训练了一个生成模型,该模型生成由预测器输出表示的内容的草图,并且我们在蓝色框中显示了一个示例输出。显然,预测器能够识别应该填充哪些部分的语义(狗的头顶、鸟的腿、狼的腿、建筑物的另一边)。
为了理解模型捕获的是什么,Meta训练了一个随机解码器,它将I-JEPA预测的表示映射回像素空间,当在蓝色框内进行预测时,它显示了模型的输出。这种定性评估表明,该模型正确地捕捉了位置的不确定性,并产生了具有正确姿势的高级物体部件(例如,狗的头,狼的前腿)。
简而言之,I-JEPA能够学习对象部件的高级表示,而不会丢弃它们在图像中的局部位置信息。
三、更高的效率和强大的性能
I-JEPA预训练的计算效率也很高。它不涉及与应用更多计算密集型数据增强来生成多个视图相关的任何开销。目标编码器只需处理图像的一个视图,并且上下文编码器只需处理上下文块。
根据经验,Meta发现I-JEPA无需使用人工制作的视图增强即可学习强大的现成语义表示(参见下图)。它在ImageNet-1K线性探测和半监督评估上也优于像素和标记重建方法。
ImageNet-1k上的线性评估性能作为GPU预训练小时数的函数。
I-JEPA还与以前依赖于语义任务上手工制作的数据增强的预训练方法相竞争。与这些方法相比,I-JEPA在物体计数和深度预测等低级视觉任务上取得了更好的性能。
通过使用更简单的模型和更少的刚性归纳偏差,I-JEPA适用于更广泛的任务集。
低镜头分类精度:在ImageNet-1k上使用1%的标签进行半监督评估(每个类大约12个标记图像)。
结语:人工智能向人类水平迈进了一步
I-JEPA展示了学习竞争性现成图像表示的架构的潜力,而不需要通过手工制作的图像转换编码额外的知识。
推进JEPAs从更丰富的模式中学习更一般的世界模型将是特别有趣的,例如,使人们能够从短上下文中对视频中的未来事件做出长期的空间和时间预测,并根据音频或文本提示调节这些预测。
Meta研究人员期待着将JEPA方法扩展到其他领域,如图像-文本配对数据和视频数据。
未来,JEPA模型可能会在视频理解等任务上有令人兴奋的应用。这是应用和扩展自监督方法来学习世界一般模型的重要一步。
标签:
您可能也感兴趣:
今日热点
为您推荐
环球滚动:“一地六县”名特优产品销售联盟在江苏溧阳成立
“铁拳”行动 | 陕西安康:“铁拳”行动查办市场领域违法案件741件 世界聚焦
天天报道:大兴调查研究 | 广东推进定点联系和对口支援工作
排行
精彩推送
- 癌症晚期有哪些征兆 当前聚焦
- 焦点热门:刚炮轰完GPT模式,杨立昆推出首个“世界模型”
- 环球简讯:人得了癌症有什么征兆
- 癌症的原因有哪些
- 恶性肿瘤的特征有哪些
- 肺癌中晚期什么症状?
- 全球头条:食道癌怎么检查出来?
- 肺癌中晚期症状?_环球视点
- 申万宏源:泰勒规则指向美联储还有几次加息?
- 每日热点:韩寒的经典爱情语录
- 肺癌中晚期什么症状?_每日看点
- 癌症晚期有哪些征兆 每日快播
- 环球热门:恶性肿瘤的特征有哪些
- 肺癌中晚期症状?|实时焦点
- 癌症的原因有哪些|快看点
- 癌症有哪些前期征兆
- 竟夕起相思小说_竟夕起相思|环球实时
- 实时:人得了癌症有什么征兆
- 安康车务段:上好“安全生产月”第一课 天天看点
- 【环球新视野】把好关不放“粽”40批次全合格
- 形容不怕困难的词语成语_关于不怕困难的成语有哪些
- 环球热讯:美国亚利桑那州一名男子被黑熊袭击致死
- 环球信息:聚焦数字世界未来发展 山东曲阜这场“尼山对话”备...
- 不做胃镜可以检查出胃炎吗? 重点聚焦
- 天天实时:肺为什么会得肺癌
- 每日报道:新美妆贴金“内耗”,李佳琦“坐庄”稳赚
- 12岁小男孩过生日送什么礼物好
- 为什么得乳腺增生?
- 乳腺增生是怎么了
- 哪种癌会遗传下一代|全球时讯
- 花旗坚定站在空头阵营 警告标普500指数突破4400后已无上涨空...
- 最新快讯!尸衣经是真的吗(尸衣)
- 电热水器插头需要装漏电保护开关_如何预防电热水器漏电情况-...
- 五种癌症可以自愈,是真的吗|全球快讯
- 脚脖子肿是怎么回事有肝硬化 当前消息
- 为何有些人不常生病且长寿?国际最新研究称与免疫恢复力有关
- 消息!痛风为什么不能吃菜花?
- 身体长有小红点是什么病?
- 时讯:使用共享单车勿忘“共享文明”
- 有痰咳不出? 世界实时
- 十堰婚纱摄影店装修_十堰婚纱摄影|微动态
- R星一波更新下架了194辆车 老玩家心都碎了 今亮点
- 女性晚上夜尿多怎么办?-每日热议
- 癌细胞每个人身体都有吗
- 要闻速递:是不是冠心病?
- 全球快消息!肺癌是怎么引起的?
- 世界热点评!肝病脸上有什么症状
- 世界热推荐:身上长小红点是怎么了
- 浩洋股份(300833):6月16日北向资金增持1900股
- 全球热推荐:现在哪个手游能赚钱_现在有什么手游可以赚钱的
- 手机淘宝申请退货退款后怎么看收货地址(手机淘宝怎么申请退...
- 运动会学校领导讲话稿
- 个性王者荣耀战队名字_王者荣耀战队名字简短好听_今日看点
- 全球看点:美团网上海(关于美团网上海的基本详情介绍)
- 环球快报:肝上长肿瘤好治吗
- 天天报道:主播跨省为“粉丝”取快递被发现内藏毒品,案件重审...
- 焦点速看:再加息1%才能让美股跌!富国银行:AI巨头将迎来“...
- 无处安放的“闲钱”
- 什么癌症手脚发麻
- 感染hpv52会传染
- 【当前热闻】癌症怎么来的
- 世界动态:98折起,91盘放“价”!佛山房博会正式开锣!
- 澳门旅游局:香港旅客量已恢复至2019年超8成水平 不再延长來...
- 天天信息:香港置业:截至6月中旬香港整体物业注册2685宗 环...
- 中钢协:6月上旬重点统计钢企粗钢日产223.11万吨 环比增长6....
- 定了!桂林已明确,6月14日起正式开始实行全民看牙补贴!-环...
- 「聚焦手汗症」扬州治手汗症医院总榜「实时公开」扬州专治手...
- 新动态:香港BUD专项基金简易申请计划推出 处理时间减半至30...
- 全球观焦点:欧洲央行9月到底加不加息?20多家大行给出答案
- 香港特首政策组专家组举行首次会议 聚焦高质量发展等议题_世...
- 滚动:江西吉安适合种什么 吉安适合种植什么水果
- 每日热闻!欧洲央行鹰派警告:加息或持续到夏季之后
- 能源价格持续下跌 英国消费者通胀预期回落
- 小心“新牛”假象!美银:美股大涨后将大跌_当前关注
- 场内ETF资金动态:硅料硅片价格下跌,行业“以价换量”逻辑兑...
- 【独家】港股IPO流程简化加速!港交所新股平台FINI外部用户测...
- 环球热资讯!与美债收益率负相关性破裂,亚股市场好兆头?
- 6月16日棉纱主力2309合约下跌0.11% 消息
- 快资讯丨深交所进一步完善可转债投资者适当性管理细则
- 天天微速讯:德国拟于电力瓶颈时期减少对电动汽车等高耗能设...
- 港人北上消费升温 香港零售业对人流量持乐观态度 世界观速讯
- 干预力度减弱 土耳其里拉遭遇24年来最长连跌
- 中科院已注册紫东太初大模型商标
- 每日观点:肝癌是什么症状?
- 身上,腿上,胳膊上起了一些红点还痒是怎么回事[at
- 北京城市副中心擦亮多张产业金名片 环球快讯
- 香港金管局:首季储值支付工具交易额为1385亿港元 环比跌14....
- 【天天播资讯】香港本地居民一季度总收入7561亿港元 同比上升6.8%
- 香港金管局:重开15年期政府债券将于6月28日进行投标
- 环球速递!湖南一地悬赏2万寻无名女尸身份,警官:悬赏仍然有效
- 世界热门:香港一季度末市面流通信用卡总数1970万张 同比上升2.8%
- 财政部:1-5月国有土地使用权出让收入14893亿元 同比下降20% 报道
- 神奇制药: 上海神奇制药投资管理股份有限公司2022年年度权益...
- 大人头顶有凹沟会不会是癌症?-快看点
- 口咽癌是怎么引起的 全球快看
- 美国凯斯公司_美国凯斯公司
- 日经225指数连续10周收高 创下10年来最长连涨记录|天天资讯
- 唐高祖武德九年秋八月甲子翻译(唐高祖)-世界快看点
- IMF:欧元区通胀仍强劲 欧洲央行需进一步加息并保持紧缩|天天看点
- 风声鹤唳!欧洲天然气市场剧烈波动 危机或正在酝酿中