当前位置:首页>热门 > >正文

AI见闻日报:将上下文学习能力从语言迁移到视觉,MetaVL开启下一个多模态时代 | 见智研究|新要闻

  • 2023-06-06 21:31:44来源:华尔街见闻

今日要点:

1、苹果在 iOS17 中加入transformer语言模型,用于提高文字和语音转文字时的准确性。


(资料图片仅供参考)

2、苹果开发人员:Vision Pro里用了“脑机接口”,通过检测眼睛等准确预测用户下一步要做什么

3、MetaVL: 将上下文学习能力从语言模型迁移到视觉,开启下一个多模态时代

4、Runway获得1亿美元D轮融资,谷歌领投

见闻视角

海外AI

1、苹果在ios17中加入transformer语言模型,用于提高文字和语音转文字时的准确性。

苹果在今日更新的ios系统介绍中,阐述了使用transformer语言模型,用于提高文字和语音转文字时的准确性,通过用于单词预测——提高了用户每次键入时的体验和准确性。而这个模型如同苹果一直以来强调对用户的隐私保护一样,是在手机端的模型。

见智研究认为,苹果使用transformer模型用于一些基础应用符合苹果一直以来的务实精神,苹果从不强调某项技术是否先进,而是要在用户体验上做到极致。这也是苹果一直强调技术落地到应用的体现。

见智研究相信苹果设备在明年将会拥有自己的llm模型,而这个模型按照苹果一贯的隐私保护模式,应为纯本地化的模型。

2、苹果开发人员:Vision Pro里用了“脑机”,通过检测眼睛准确预测用户下一步要做什么

一位在AR/VR领域工作十年、担任苹果AR神经技术研究员的网友Sterling Crispin发推文,介绍了苹果AR的神经技术研发

根据Crispin的介绍和苹果的专利说明,苹果的神经技术可以做到预测用户行为、根据用户状态调整虚拟环境。

最酷的结果是在用户实际点击之前预测他们会点击什么,人们的瞳孔在点击之前往往有反应,原因是人们会期望在点击之后会发生什么。

这时可以通过监测用户的眼睛行为来创造生物反馈,并实时重新设计用户界面,以创造更多预期的瞳孔反应。这是一个通过眼睛实现的粗略“脑机接口”,用户不用接受侵入性的脑部外科手术。

推断认知状态的其他技术,包括以用户可能无法察觉的方式向他们快速闪现视觉或声音,然后测量他们的反应。

见智研究认为,苹果通过全新的神经技术对人的行为进行预测,从而大幅减小了vision产品整个UI操作的延迟,大幅提升用户体验。从无数细节中可以看到,苹果在用搬山能力处理每一个细节,这个软硬整合能力,不是谁能可以随便模仿的,它所体现的每一个细节,都看出苹果花费巨大的功夫在解决交互体验。这也是苹果之所以伟大的地方。

3、MetaVL: 将上下文学习能力从语言模型迁移到视觉,开启下一个多模态时代

动机:研究如何在视觉-语言领域实现上下文学习,将单模态的元学习知识转移到多模态中,以提高大规模预训练视觉-语言(VL)模型的能力。方法:首先在自然语言处理(NLP)任务上元训练一个语言模型,实现上下文学习,然后通过连接一个视觉编码器将该模型转移到视觉-语言任务上,以实现跨模态的上下文学习能力的转移。优势:实验证明,跨模态的上下文学习能力可以转移,该模型显著提高了视觉-语言任务上的上下文学习能力,并且在模型大小方面能够有显著的优化,例如在VQA、OK-VQA和GQA上,所提出方法在参数数量减少约20倍的情况下超过了基准模型。

见智研究一句话总结:

M Monajatipoor, L H Li, M Rouhsedaghat, L F. Yang, K Chang探索了将元学习的上下文学习能力从单模态迁移到多模态的可能性,证明了在视觉-语言任务中通过迁移可以显著提升上下文学习能力,甚至在模型大小方面实现优化。

这意味着多模态情况下的对话能力将得到加强,对于现有的文生图来说可能会带来新的变化,生成模式对用户将更友好。

4、Runway获得1亿美元D轮融资,谷歌领投

生成式AI平台Runway获得1亿美元D轮融资(约7亿元),估值15亿美元,本次由谷歌领投。谷歌投资Runway的最大原因之一是为了争夺云计算客户。

Runway曾在4月底与谷歌签订了7500万美元的3年商业协议,同时Runway已从谷歌获得了价值2000万美元的云计算资源用于产品运营和研发。

见智研究曾使用过GEN-1生成相应视频特效,但目前可玩性不算高。Gen-2是Runway在今年3月最新发布的,但目前手机客户端还未提供使用。Gen-2可以通过文本、图片、文本+图片直接生成视频,同时支持风格化和渲染添加好莱坞式大片特效,仅需要几分钟即可完成所有操作。

风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

标签:

延伸阅读

推荐阅读

AI见闻日报:将上下文学习能力从语言迁移到视觉,MetaVL开启下一个多模态时代 | 见智研究|新要闻

1、苹果在iOS17中加入transformer语言模型,用于提高文字和语音转文字

看点:6月7日!第12届北京国际汽车制造业博览会明天启幕!

由北京亚太瑞斯会展服务有限公司主办的2023第十二届北京国际汽车制造及

庄浪:种养一体化 走出循环农业新路子

“以农养牧,以牧促农”的循环经济,是现代农业高质量发展的重要模式。

2023年湖南高考志愿填报政策办法

近日,《湖南省2023年普通高等学校招生网上填报志愿工作实施方案》发布

卢旺达总统任命新国防部长

据卢旺达总统府6月5日消息,卢旺达总统保罗·卡加梅任命胡维纳尔·马里

今日热闻!大宗交易:片仔癀成交2466.89万元,成交均价296.50元(06-06)

2023年6月6日,片仔癀发生3笔大宗交易,总成交8 32万股,成交金额2466

资生堂_盼丽风姿智感眼霜怎么样价格好用吗

盼丽风姿智感抚痕眼霜是一款盼丽风姿系列的产品,简称抗皱“小雷达”眼

世界热资讯!绝味食品(603517.SH)拟每股派0.18元 于6月14日分红

智通财经讯,绝味食品(603517 SH)公告,公司2022年年度权益分派拟:每

dnf假紫怎么处理_有什么处理的办法-观速讯

解答:1、假紫的主流处理方式是直接扔到店里,直接拍卖,用分解机分解

温馨提示!2023年首届绿色低碳发展高峰论坛参会指南_全球今热点

▲论坛主题:“碳”索绿色“能”创未来▲论坛时间及地点:时间:2023年

武进不锈(603878)6月6日主力资金净卖出169.72万元

截至2023年6月6日收盘,武进不锈(603878)报收于8 22元,下跌1 67%,换

百色受贿罪如何判刑

受贿罪,一般会判三年以下有期徒刑或者拘役,并处罚金;数额巨大的,会

视讯!证券板块跌1.69% 海通证券涨0.53%居首

今日,证券板块整体跌幅1 69%,其中,1只股票上涨,49只股票下跌。数据

全球简讯:美国防部授予普惠价值20亿美元的新批次F-35发动机合同

中国航空新闻网讯:据美国《空军与太空力量》杂志网站报道,美国国防部

疑似比亚迪F品牌官方账号成立:名为“方程豹汽车”|天天新消息

快科技6月6日消息,疑似比亚迪F品牌官方账号成立,名为“方程豹汽车”

感觉孩子越长越丑?一查竟是它在作怪……|全球热点评

近日,“腺样体面容” 登上热搜一位不少人在这个话题上发问:“什

超七千辆出租车公交车参与福建省高考保障_每日简讯

超七千辆出租车公交车参与福建省高考保障

货车撞上围栏致LNG动力罐脱落 万宁消防紧急救援

商报全媒体讯(椰网 海拔新闻记者李兴民通讯员卓欣欣摄影报道)6月5日

高考700分和存款700万你选哪个

这是个好问题,但问题就在于——现实生活中,大部分人这两样一个都没有

金桥信息6月6日盘中涨幅达5% 每日报道

以下是金桥信息在北京时间6月6日10:06分盘口异动快照:6月6日,金桥信

每日聚焦:杭州十条河道开放水上运动 可以玩皮划艇、桨板、赛艇、龙舟 全球关注

杭州十条河道开放水上运动可以玩皮划艇、桨板、赛艇、龙舟杭州网发布时

迷信“985”“211”房号,家长别给商家“递刀子”

迷信“985”“211”房号,家长别给商家“递刀子”  据澎湃新闻6月4日

巴菲特笑了!日股再创牛市里程碑 “日特估”持续火爆

随着日本股市日内一路高歌猛进,逾越32000点大关,无疑再度向世人彰显

美股数字货币/区块链类股普跌,美国SEC起诉币安

【美股数字货币 区块链类股普跌,美国SEC起诉币安】BitDigital收跌9 45

天龙八部逆袭攻略(天龙八部逆袭地图点)|当前播报

1、刷逆袭地点什么的根本不管用,因为来来去去的队伍实在是太多了,而

合金投资:2日累跌超20% 近期经营情况及内外部经营环境未发生重大变化 环球滚动

合金投资6月5日公告,公司股票于6月2日、6月5日连续两个交易日收盘价格

高雅艺术进校园 雷波民族音乐专场走进西华大学-天天新视野

由教育厅、文旅厅主办的四川省2023年高雅艺术进校园雷波民族音乐专场新

猜您喜欢

Copyright ©  2015-2022 每日服装网版权所有  备案号:浙ICP备2022016517号-15   联系邮箱:5 146 761 13 @qq.com