今天凌晨,谷歌的 I/O 2024 大会也如约而至了。。。
发布会是在美国山景城开的,咱编辑部也派人去了现场,听身处前线的同事讲,不知道是不是 OpenAI 抢了风头的缘故,今年现场的氛围似乎都没前几年那么热闹了。
在以前,用万国来朝形容 I/O 大会都不为过,而今年很明显人没那么多( 不过以前有卖门票,这次没卖 )。
不过这毕竟还是谷歌,在整整快两个小时的发布会里,蹲在屏幕前看的世超,还是被秀了好几波肌肉。
简单一句话概括,和昨天的 OpenAI “ 小而美 ” 的春季发布会比起来, I/O 大会完全就是 “大而全” 。
反正就是各种和 AI 能挂上钩的东西,他们都来了一遍,从最基础的大模型,到能生成视频、音乐的 AI ,再到 TPU 芯片等等。
世超也从里面挑了几个比较亮眼的产品,来和大伙说道说道。
首先,世超觉得,昨天 OpenAI 发布会就是对着今天谷歌狙击的。。。
谷歌这次重点推出的多模态 AI 助手Project Astra,和昨天 OpenAI 的 GPT-4o 几乎没差,都是能和多模态实时交互的 AI 。
把麦克风、摄像头的权限给 Project Astra 之后,它能眼观六路、耳听八方,随便问啥,它都能第一时间给出答复。
比如让它看看办公室里有没有会发出声音的东西,当镜头扫过一个音响时,它立马就能反应过来。
想再了解了解音响的构造啥的,也能直接在屏幕上写写画画,然后提问,整个过程 Project Astra 全都能看懂。
而且因为有最新的 Gemini在背后撑腰,它的理解能力也是一绝。
随机找到一个程序员的工位,指着屏幕里的代码问是干啥的, Project Astra 没反应几秒就能给出答案,而且还能准确说出用了啥代码。还有搞个 “ 薛定谔的猫 ” 梗图,它也能迅速猜出来。
不过它和 GPT-4o 还是有点区别在的,就是说话的语气语调啥的,没昨天的 GPT-4o 的人味儿那么重, Project Astra 稍微有点高冷的味道。
而且 Project Astra 身上还有一个 GPT-4o 没展示的技能,有记忆,比如在演示里, Project Astra 能准确记住,镜头一扫而过的桌子上,放了一个苹果。
这对实时交互 AI 来说,算是相当关键的一个能力了。不过在前线的同事跟世超说,现在 Project Astra 就只能记一分钟的事儿,但之后上线的版本肯定能记更多。
但有一说一,就算是世超,也不能把过去一分钟看到了东西一五一十的全记下来。。。
要不是昨天 GPT-4o 已经抢先亮相了一波, Project Astra 一定会被各路媒体打上 “ 炸裂 ” 、 “ 史诗 ” 、 “ 颠覆 ” 、 “ 改写历史 ” 的标签。
可惜,仅仅是晚了一天,现在大家对 Project Astra 的形容只有一个标签: “ 跟 GPT-4o 好像 ” 。
真心建议谷歌抓一下内鬼。
除了多模态实时交互的 AI 外,谷歌还一次性放出了各种单独的多模态 AI,有文生图的 Imagen 3 ,文生视频的 Veo ,文生音乐的 Lyria 。
而这些,世超觉得,就是摆明了对标市面上的那些 Sora 、 Suno 之众。
像是文生视频的 Veo ,从 1080p 的画面效果,还有 60 秒的时长,都要和 OpenAI 的 Sora 看齐。
不过谷歌没学 Sora 用 DiT ( Diffusion Transformer )架构,而是自己揉了好几个老模型,像是 GQN 、 DVD-GAN 、 Imagen-Video 、 Phenaki 、 WALT 等等。
从最后生成视频的效果来看,和 Sora 也确实有的一拼。
谷歌自个儿也说了, Veo 能驾驭各种风格,航拍、延时摄影等等镜头语言都能秒懂。。。
有意思的是,谷歌在每个视频下面都特意标了一行小字:所有视频均由 Veo 生成,未经修改。
在点谁应该就不用世超多说了吧。。。
而除了上面这些,谷歌还推出了对标 GPT-4 Turbo 等轻量性能大模型的 Gemini 1.5 flash 、对标 llama 3 等开源大模型的 Gemma 2 ,还有 Google 自家的新 TPU 等等。。。世超在这儿就不一一介绍了。
反正看起来,谷歌似乎不愿放弃AI 领域里的每个赛道,想把自己打造成一个 AI 界的六边形全能战士。
而更可怕的是,在各个领域里, Google 相比友商虽然都不一定是最好的,但也并不落后多少。
同时,谷歌的上限和野心,肯定不限于此。因为谷歌还拿出来些不少其他大厂单打独斗,绝对拿不出来的东西。而世超觉得,正是这些东西,有机会能让谷歌从AI 领域的追赶者,跻身为领跑者。
因为谷歌,拥有其他AI 巨头所没有的成熟系统与应用生态。
这次 I/O 大会上,谷歌就展示了好几个这样的例子。
比如他们先展示了一波 Gemini 和 Google 相册的结合。记不清自个儿车的车牌号,在 Google相册里搜索 “ 查找车牌号 ” , Gemini 能直接从图库里准确找到车的照片,并把车牌号告诉你。
还有在谷歌 Gmail邮箱里,你也能让 AI 帮你查航班信息,在谷歌地图里,能让 AI 帮忙获取酒店附近的餐厅和旅游景点,再给计划相应的日程。
这还没完,谷歌的老本行搜索这次也上 AI 了,而且一上来就搞了波大的,支持语音、图片,还有视频搜索。
比如说唱片机坏了想查查原因,直接镜头对准故障位置问就行了, AI 会立马反应给出答案。
还有压箱底的胶片机不怎么会使,同样拍给它看就行了,不需要自己再绞尽脑汁去形容。
只不过,这次谷歌又在演示上翻车了。。。有媒体扒出,胶片机的那个回答完全就是在胡扯,回答中的一个建议是 “ 把胶卷取出来看看 ” ,而这样只会让整卷胶卷直接报废。。。
不过,这至少说明他们玩儿的就是个 real ,毕竟大模型乱讲话这事儿一直存在,而出错,比造假还是强一些的。
总之,按照谷歌的说法, Gemini 大模型正在全面整合谷歌的那一大家产品中,包括在未来,他们将把AI 直构建到 Android 操作系统的底层之中,准备改写用户和手机之间的交互方式。
他们也举了一些例子,像是用手机看球时,不知道运动员犯没犯规,圈起来就能问,还有做题时圈一圈就能搜题。
而且显示答案的时候,它也不会跳转到别的 AI 软件里面去,属于是把 AI 融到系统最最最底层了。
甚至在打电话的时候, AI 还能实时反诈,能从对话中直接判断对方是不是骗子,要是有可疑的字眼,立马会弹窗提示。
其实看到这的时候,世超已经感受到了谷歌做 AI 的优势,未来 AI 肯定要朝着底层生态去发展。
而作为一家大企业,谷歌手里的资源是相当多,而且还有安卓这个大阵营,它能轻易把 AI打入安卓内部,但 OpenAI 要和 iOS 深度结合,估计没这么随心所欲了。
总之这次谷歌的 I/O 大会啥产品都有,但要说出类拔萃,还谈不上。不过,在AI 应用集成这一个最直面消费者的维度上看,谷歌还真是目前 AI 领域的集大成者之一。
这一波,去年还被称作是 AI 圈 “ 仲永 ” 的谷歌,算是渐入佳境了。
不过世超看完谷歌的 I/O 大会,倒觉得他们这次不仅仅要 “ 狙击 ” OpenAI ,更要把苹果生态也一起狙了。。。
所以下一回合,到苹果你了。
上个月,火狐浏览器凭一个骚操作,把一堆用户都惹急了。但奇怪的是,这怎么看都是一个大新闻的事故,世超却没看到多少媒体报道。。。事情是这样。火狐浏览器有个夜间模式,打开会反...
2 GPT-4升级被曝引入Q*,推理/数学更强废话更少,竞技场重夺王位新版GPT-4是在Q*的输出上微调的? 在竞技场重回榜一的新版GPT-4 Turbo,成功再次踩中大家嗨点。 它此次的性能提升体现在数学、推理、代码上,而且输出内容废话更少。 最让大家感...
3 到了东南亚,拼多多才发现自己居然还不够野...把拼多多和东南亚摆在一起,很多人第一直觉一定是:最擅长做增长和下沉市场的拼多多肯定随便拿下啊。然而事实并非如此。TEMU 在日本和韩国上线亚洲试点成功后,几乎立马开始了东...
4 商汤升级“日日新5.0”大模型,对标GPT-4Turbo·“日日新5.0”采用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“...
5 卖得最火的 AI 硬件 Rabbit R1 首批体验出炉:还没干翻 app,被质疑造假两周前, Ai Pin 的第一批用户在体验产品过后,出奇地达成了一致评价:噱头大于实际,取代手机还为时过早。当时,Rabbit 创始人吕骋(Jesse Lyu)也没错过这个落井下石的大好机会,通过一...
6 ChatGPT新增临时聊天功能:对话不留痕迹5月2日消息,近日,OpenAI发布更新,为ChatGPT新增了“临时聊天”功能。为满足用户对隐私的进一步需求,OpenAI 引入了 " 临时聊天 " 功能。通过这一功能,用户可以与 Chat...
7 谷歌面临史上最大威胁!曝OpenAI将发布搜索引擎5月6日消息,据多家媒体近日报道,OpenAI正在计划一款基于其ChatGPT聊天机器人的大型产品——全新的搜索引擎。前Mila研究员、麻省理工讲师Lior S爆料称:"OpenAI即将...
8 首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源5月14日消息,今日,腾讯旗下混元文生图大模型(混元DiT,Diffusion Models with Transformers)宣布全面开源。目前已在Hugging Face、Github上发布,包含模型权重、推理代码、模型算...
9 都说谷歌被OpenAI狙击了,我怎么觉得它在狙苹果今天凌晨,谷歌的 I/O 2024 大会也如约而至了。。。发布会是在美国山景城开的,咱编辑部也派人去了现场,听身处前线的同事讲,不知道是不是 OpenAI 抢了风头的缘故,今年现场的氛围...
备案号:粤ICP备2023097408号 Copyright © 2020-2021 海南金游汇电子竞技有限公司 版权所有