起源:被银行员工转走的1800万已全数返
谷歌I/O大会的10个新器材,用Gemini收受所有
一年一度的谷歌I/O大会,重磅来袭。
谷歌官方这次一口气颁布了24篇I/O有关布告,信息量很大,但主线并不复杂:底层模型更新到Gemini 3.5,并推出面向视频和多模态创作的Gemini Omni;用户入口上,Gemini App起头往幼我助理方向走;搜索起头参与更多AI模式和智能体能力;购物、办公、开发工具也都被重新接入Gemini;硬件上,谷歌还展示了搭载 Gemini 的智能眼镜。
重点在于,今年不仅有模型能力的提升,谷歌还把Gemini塞到了各类处所。
从搜索框,到购物车,再到智能眼镜……谷歌在用AI收受所有。
我们整顿了这次大会上最值得关注的10个新器材,一路来看:
Gemini 3.5:迄今为最强的编码、智能体模型
先来看备受关注的底层模型。
这次谷歌颁布了Gemini 3.5系列,首发的是Gemini 3.5 Flash,3.5 Pro还在内部使用,打算下个月推出。
固然3.5 Flash名字里还是Flash,但它的定位已经不只是“快”和“便宜”,能够说,它是谷歌这次所有Agent产品的发起机。
3.5 Flash面向的是编码、智能体工作和真实工作流,已经进入Gemini App、Google Search的AI Mode、Google Antigravity、Gemini API、Android Studio,以及企业平台。
跑分方面,Gemini 3.5 Flash在编码能力、Agent能力、工具挪用能力上比3.1 Pro强了不少,但在Humanity's Last Exam和ARC-AGI-2上还是有所不及。
输出速度上,比其它前沿模型快4倍,在人为智能分析指数中位列右上象限——意思是又快又强。
定价上,3.5 Flash输入$1.50/百万token,输出$9.00/百万token,比3 Flash贵了3倍,比3.1 Pro便宜40%。
官方给了几个典型场景:好比开发利用、守护代码库、筹备财政文件、整顿非结构化资产、把旧代码库迁徙到Next.js,甚至让两个agent合作,把AlphaZero论文读完,再做出一个可玩的游戏。
在Gemini 3壮大的多模态基础之上,3.5 Flash能够天生更丰硕、更具交互性的Web用户界面和图形。
它能够在不到一分钟里天生6个分歧的支付页面,也能够一次做出64个分形图案变体;用户只有效文字描述一个设法,它就能天生可互动的网页组件。
更复杂一点,它还能把论文、课程视频造成互动式进建卡片和可视化页面,甚至在Google搜索里,凭据用户的问题现场天生图表、仿照器和沉浸式诠释界面。
以前各人对Flash类模型的印象是:便宜、快、适合轻量工作。但此刻谷歌要表白的是,将来的Agent不成能每一步都挪用最贵、最慢的大模型。真正能规;芷鹄吹腁gent,必要一个速度、成本和能力都比力平衡的模型。
这就是Gemini 3.5 Flash的地位。
Gemini Omni:谷歌版全模态天生模型
除了Gemini 3.5,这次谷歌还颁布了一个更偏创作的新模型:Gemini Omni。
谷歌对它的定位是:can create anything from any input(从任何输入,天生任何内容)。
当然,此刻第一步还是视频。之后谷歌还打算支持图片、音频等更多输出大局。
首个上线的是Gemini Omni Flash,已经向Google AI Plus、Pro和Ultra订阅用户盛开,能够在Gemini App和Google Flow 中使用;YouTube Shorts和YouTube Create App也会免费接入。将来几周,谷歌还会把它通过API盛开给开发者和企业客户。
Omni不是一个单纯的文生视频模型。它能够把文字、图片、音频、视频一路作为输入,而后天生一段齐全视频,并且支持对话式视频编纂。
官方还展示了一个陆续批改的例子:先天生一个幼提琴手演奏的视频,而后把幼提琴手放进另一张图片里的环境,再把幼提琴造成通明,最后把镜头角度改成从幼提琴手肩膀后方看。整个过程是一轮一轮接着改,而不是每次推倒重来。
谷歌还出格强调,Omni背后接的是Gemini的世界知识。它对重力、动能、流体这些物理成效有更好的理解,也能够把复杂概想做成诠释视频。行动会产生后果,环境会对事务做出反映,叙事会按逻辑发展。
换句话说,谷歌想表白的是,AI视频不是只能做炫酷短片,也能够造成一种知识表白工具。复杂概想、科学过程、讲授内容,都能够被转成更直观的视频。
和Seedance 2.0一样,Omni也能多种参考素材来天生视频,图片、视频、音频、音乐都能够成为输入。用户能够让它保留某张图里的角色,借用一段视坡凤的作为,再让画面追随音乐节拍变动,最后天生一段新的齐全视频。
官方还提到,用户能够从已有素材启程:用草图作为作为参考,把它造成真实影像;例如用视坡凤的鲸鱼游动作为,迁徙到一种反光流体资料上;或者保留房间结构不变,只把植物造成半通明的发光植物,并让萤火虫和声音节拍互动。
单一点说,Omni想让用户可能“把各类素材、风格、作为和声音,重新组织成一个新视频”。这对创作者很重要。
不外,看社群反映,它用起来并没有Seedance 2.0杰出……但这只是Flash版本的一个起头,对吧?
安全方面,Omni支持用户创建自己的数字分身,也就是用自己的声音和形象天生视频。但谷歌强调,其他涉及改音频、改语音的能力还在测试中,必要更审慎地推出。所有Omni天生的视频城市带有不私见的SynthID数字水印,用户能够通过Gemini以及Google搜索来验证内容是否由Gemini Omni天生。
Gemini App:大更新
这次Gemini App也大改。
谷歌说,今年对Gemini App来说是“硕果累累的一年”。去年I/O时Gemini App有4亿用户,此刻已经有超过9亿月活,覆盖230多个国度和70多种说话。
这次 Gemini App 的更新重要有几个:
第一,接入Gemini 3.5 Flash。
第二,推出新的设计说话Neural Expressive。界面会更动态,有流体动画、更鲜明的色彩、新字体、触觉反馈。Gemini Live也被直接整合到Gemini,用户能够从打字天然切到语音对话。谷歌还说,Gemini以来不只是给你一堵文字墙,而是会凭据问题实时天生更适合的回覆大局,好比图片、交互功夫线、旁白视频、动态图形等。这个新设计从今天起在Web、Android、iOS全球推出。
第三,Gemini App接入Gemini Omni,能够直接天生和编纂视频。用户能够上传手机相册里的素材,用模板、提醒词、布景代替、电影感变焦等方式做视频。甚至能够创建自己的数字分身。
第四,是Daily Brief。它像一个早晨简报Agent,你授权之后,它会在后盾看你的 Gmail、Calendar,把垂危邮件、接下来的日程、必要跟进的事项整顿成一个早间提要。它不只是总结,还会按你的指标排序,并建议下一步。Daily Brief从美国起头,面向Google AI Plus、Pro、Ultra用户推出。
第五,也是最重要的,是Gemini Spark。
Gemini Spark:谷歌版24幼时幼我Agent
Gemini Spark是这次最值得单独介绍的产品之一。
谷歌给它的定位是24/7 personal AI agent。也就是说,它能够在你授权下,持续助你做事。
它运行在Gemini 3.5上,使用Antigravity harness,并且深度衔接Gmail、Docs、Slides等工具。并且由于它是云端Agent,所以你关掉电脑、锁上手机,它也能够持续在后盾工作。
谷歌举了几个例子。
好比你能够让它定期解析每月信誉卡账单,找出新增订阅或者暗藏用度;或者教它查抄孩子学堂邮件,把重要日期提取出来,每天发一份简报给你和伴侣;再好比,你能够让它从邮件和谈天纪录里的会议笔记中提炼信息,整顿成Google Docs,振兴草一封项目启动邮件。
这是典型的Agent叙事:助你跨利用实现一串作为。
这也是谷歌最有优势、也最敏感的处所:它手里有Gmail、Calendar、Docs、Drive、Slides、Maps、YouTube、Search。只有效户愿意授权,Gemini能够触达的幼我高低文,将成为一个极度重大的生态。
当然,谷歌也在强调权限和安全。Spark必要用户选择是否开启、衔接哪些App;涉及花钱、发邮件等高风险作为时,会先询问用户。
这一职能本周先面向trusted testers,下周打算作为Beta推给美国Google AI Ultra用户。
macOS版Gemini:起头进入桌面工作流
Gemini App还有一个比力容易被忽略的更新:macOS桌面版。
谷歌说,Gemini的macOS App已经能够下载,接下来会把Gemini Spark带到桌面端,让它处置本地文件,并自动化桌面上的工作流。它还会参与新的语音能力:用户能够对着屏幕说一段并不齐全、同化着搁浅和口头禅的话,Gemini能凭据屏幕高低文,把它整顿成更正确的文本,并直接放到光标地点地位。
这件事看起来幼,但也值妥贴心,由于Agent最终不成能只在网页里工作。好多真实工作发生在本地:文件加注桌面软件、浏览器、多窗口、多文档之间。谷歌把Spark带到macOS,其实就是在往桌面Agent的方向走。
我们之前写过一篇文章,说PC才是agent时期的头等硬件,谷歌之前在The Android Show上颁布的各种更适应真实工作流的软硬件产品,和这件事也是互通的。
Google Search:搜索框25年来最大改版
这次最有象征意思的产品,还是Search。
谷歌说,AI Mode上线一年后,月活已经超过10亿,查问量每个季度翻倍。此刻,谷歌把Gemini 3.5 Flash作为AI Mode的默认模型,并颁发对搜索框进行25年来最大升级。
新的搜索框不再只是输入关键词的幼框,造成了一个AI入口。
它会动态发展,让你用更天然的方式描述问题;它会凭据意图给出AI建议,不只是传统自动补全;它支持多模态输入,能够用文本、图片、文件、视频,甚至Chrome标签页作为输入。
也就是说,搜索不再只是“给我十个链接”,造成了“我有一个问题、一段资料、一张图、一个网页高低文,你助我理解并持续往下走”。
另表,AI Overview 也能够更天然地接入AI Mode。用户能够直接对AI Overview持续追问,搜索会带着高低文进入对话。这个履历已经在桌面和移动端全球上线。
Search这次还有一个更Agent化的能力:Search agents。
谷歌说,用户以来能够在Search里创建、定造和治理多个AI agents。第一批是information agents,信息型Agent。它们能够24幼时在后盾监控你关切的信息,而后在相宜的时辰给你一份综合更新。
这和Google Alerts很像,但更智能。
Google Alerts只能按关键词订阅。Search agents订阅的是“你的意图”。它不像爬虫那样只看某个词有没有出现,而是理解你到底要什么,而后跨网页、新闻、社交、购物、体育、金融等信息源监控变动。
information agents今年夏天先给Google AI Pro和Ultra用户推出。
此表,Search还在扩大agentic booking,也就是助你实现预约类工作。好比你要找一个周五晚上、能坐6幼我、供给夜宵的个人KTV房间,Search会综合价值和可用性,并给你直接实现预约的入口。部吩旆类,好比家政维建、美容、宠物护理,用户甚至能够让Google代为给商家打电话。这些能力今年夏天在美国面向所有效户推出。
另表,谷歌还把Antigravity和Gemini 3.5 Flash的编码能力带进了Search。指标是让搜索了局不再只是文本、图片、表格,而是凭据你的问题即时天生相宜的交互界面。
好比你想理解天体物理,或者想看腕表内部怎么运行,Search能够实时组装交互视觉、表格、图表、仿照器。这些generative UI能力今年夏天会免费盛开给所有Search用户。
更进一步,Search还可以为持续性工作天生mini apps。好比你在搬场、筹备婚礼、治理健全打算,不是一次搜索就实现,而是一个持久项目。Search能够给你天生一个自界说dashboard或tracker,以来你能够持续回来用。
这极度像一个新的产品状态:搜索了局不再是网页,造成了一时天生的幼工具。
Universal Cart:谷歌想做AI购物车
购物也是这次大会的大更新之一。
谷歌颁布了Universal Cart,一个跨服务、跨商家的智能购物车。它能够呈此刻Search、Gemini、YouTube、Gmail里。用户在搜索商品、和Gemini谈天、看YouTube、读Gmail的时辰,都能够把商品参与统一个购物车。
但它不是通常的购物车。
商品一参与购物车,它就会在后盾起头工作:找优惠、追踪价值降落、查看价值汗青、提醒补货。它还会用推理能力提前发现问题,好比你在分歧零售商那里买电脑配件,它会提醒你哪些零件不兼容,并推荐代替规划。
由于它基于Google Wallet,还能理解你的支付方式权利、会员信息、商家优惠,助你找到暗藏折扣或者积分机遇。
结账时,Universal Commerce Protocol会让用户用Google Pay急剧实现采办,或者把商品转到商家网站持续下单。
谷歌提到,Nike、Sephora、Target、Ulta Beauty、Walmart、Wayfair,以及Shopify 上的Fenty、Steve Madden 等品牌会参加有关结账能力。Universal Cart今年夏天会先在美国的Search和Gemini App推出,之后进入YouTube和Gmail。
谷歌还提到Agent Payments Protocol,AP2。它的主张是让Agent代表用户安全付款。用户能够给Agent设定严格天堑,好比只能买哪些品牌、哪些产品、最多花几多钱。AP2会在用户、商家、支付处置方之间创建可验证的纪录,让Agent的采办行为有天堑、有痛处、有追踪。谷歌说,AP2会在将来几个月进入Google产品,首先从Gemini Spark起头。
不外……购物也就算了,谁会想让AI助你一键付款呢。
智能眼镜:Google Glass的AI时期重启
硬件侧最值得关注的是智能眼镜。
以前Google Glass的确做得挺烂的,甚至能算是硅古撞件史上“技术很酷,但产品没想领略”的典型案例。
这次和昔时Google Glass最大的分歧是产品逻辑换了。Google Glass像是把手机通知、拍照、导航这些职能,硬塞到面前,但这次的Gemini智能眼镜更像是:让AI随时看见你看到的器材、听见你听到的器材,而后助你理解和处置。
也就是说,它不再只是“戴在脸上的幼屏幕”,造成了一个更天然的AI入口。
在今年的I/O大会上,谷歌分享了更多关于智能眼镜的信息:这种眼镜能够在不打断你的情况下,即时提供援手。
智能眼镜分为两种:一种是音频眼镜,能够在你的耳朵里提供语音援手;另一种是显示眼镜,能够在你必要的时辰立即显示所需信息。这两种眼镜都能让你解放双手,专一于其他事件,只需开口询问,即可获得Gemini的援手。
音频眼镜会先上市,今年秋天推出。
样子看起来,怎么说,挺日常的。
职能上,它能够通过“Hey Google”或者轻触镜腿唤起Gemini。用户能够问它面前看到的器材,好比路过一家餐厅,问它评价怎么样;看到一块云,问这是什么云;看到复杂停车标志,让它助你诠释。
它还支持导航,也能够接电话、发短信、总结错过的新闻、播放音乐;能够拍照和视频,并用Nano Banana做图像编纂,好比拍完照直接说“给每幼我戴上搞笑帽子”;还能实时翻译语音和文字,翻译语音时甚至会尽量匹配措辞人的语气和音高。眼镜也能够衔接 Uber、Mondly等手机利用,并同时支持Android和iOS。
固然不好说现实使用成效若何,但这次至少避开了Google Glass昔时的几个坑:
不再把眼镜当成微型手机,主题不是通知和幼屏幕,而是Gemini对现实世界的理解和工作执行;不再一上来押正视AR,先推音频眼镜,降低硬件难度和社会接受门槛;不再忽视表观,找Gentle Monster和Warby Parker,认可眼镜是时尚消费品,不是纯科技产品。
终于当初Google Glass长这样:
场景也更分了然。导航、翻译、鉴别面前事物、总结新闻、拍照编纂、叫车点单,这些都更靠近“我为什么要戴它”。
Google Antigravity 2.0:开发者侧的Agent工作台
开发者侧,最重要的是Google Antigravity 2.0。
谷歌把它称为agent-first development platform。也就是说,它不是通常 IDE 插件,而是一个以Agent为中心的开发平台。
这次I/O大会颁布了Antigravity 2.0桌面利用、Gemini API里的Managed Agents,以及AI Studio的原生Android vibe coding。
从前AI编程工具的主题是“助你补代码、写函数、诠释报错”,此刻谷歌想做的是“从prompt到出产就绪app”,也就是你给一个指标,AI就能规划、拆工作、挪用工具、跑测试、建bug、部署,并且可能让多个子Agent并行工作。
这和Codex、Claude Code、Cursor竞争的是统一条赛路。谷歌的优势在于它不只有模型,还有Android、Firebase、Cloud、Workspace、Play Store、Search、Chrome 等齐全生态。
Project Genie + Street View:世界模型起头衔接真实街景
另一个偏前沿的产品是Project Genie。
Genie是Google DeepMind的通用世界模型,能够天生多样化、可交互的环境。谷歌说,它已经成为钻研工具,能够让Agent在复杂虚构环境中进建和推理,也援手Waymo(Alphabet旗下的自动驾驶公司)仿照高真实度路路环境。
这次的新能力,是把Genie和Google Street View衔接起来。
也就是说,Genie 的天生能力起头和Google近20年街景图像结合,让模型天生的环境能够锚定真实世界。谷歌说,这可以为AI agents或机械人提供虚构环境,让它们在其中导航、互动、进建现实世界的复杂性。
机械人和自动驾驶必要大量真实世界数据,但现实世界测试昂贵、危险、慢。世界模型能够提供虚构训练;而Street View则是谷歌独有的数据资产。二者结合,意味着谷歌能够把真实街景造成可交互的仿照环境。
换句话说,Project Genie是谷歌把“地图资产”造成“AI训练环境”的尝试。
今年Google I/O不是一个单点颁布会,而是一次生态铺开。
模型层,谷歌颁布Gemini 3.5和Gemini Omni。前者面向行动和 Agent,后者面向全模态天生和视频编纂。
产品层,Gemini被塞进Search、Workspace、Shopping、Flow、AI Studio、智能眼镜。它不再只是一个App,而是Google产品体下凤的统一智能层。
贸易层,谷歌起头把Agent落到真实工作上:助你盯信息、订服务、管购物车、处置邮件、写文档、做App、天生视频、甚至辅助科研。
这次大会的一个显著趋向是,谷歌在把Gemini刷新成Google生态的操作系统。
从前的Google,是一个你自动使用的工具箱,你能够用它搜索、发邮件、写文档……此刻,谷歌想让Gemini站在这些工具之上,理解你的意图,挪用这些工具,替你实现一串作为。
今年I/O的颁布看起来出格多、出格散:搜索、购物、办公、视频、眼镜、开发、科研,险些每条线都在讲AI,它们指向的其实是统一件事:
谷歌想要证明,自己依然占有把AI造成日常入口的最大生态。
@杨雅康:把坤,沙梅特:我们要在G4终结系列赛@陈铭侑:印度到底有多热
@丁佳霖:浏阳烟花厂爆炸已致21死61伤
热点排行
- 1 老司机看片app
- 2 性爱免费视频
- 3 暗TV9.1.1.1官网入口
- 4 小黄书在线免费观看
- 5 邪态动恶
- 6 精品国产 白哲
- 7 我爱AVAV永久网地址
- 8 日韩卡一
- 9 曰韩人妻无码精品-专区