开源大模型在AI竞赛中再扳回一城。
6月7日,阿里云发布开源模型Qwen2-72B。根据官方宣称,Qwen2不仅超过此前Meta推出的开源模型Llama3-70B,也超过了百度文心4.0、字节豆包pro、腾讯混元pro等众多中国厂商的闭源大模型。
据阿里云介绍,本次开源的Qwen2-72B大模型在自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的开源模型,包括阿里云在4月底开源的Qwen1.5最大的模型Qwen1.5-110B。
阿里云通义千问团队披露称,Qwen2实现了整体性能的代际飞跃。该系列包含5个尺寸的预训练和指令微调模型,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B。所有尺寸模型都使用了GQA(分组查询注意力)机制,以便让用户体验到其带来的推理加速和显存占用降低的优势。此外,模型的多语言能力和上下文长度支持均得到了提升。
目前所有用户都可以在阿里旗下的AI模型社区魔搭社区和开源平台Hugging Face上免费下载开源模型Qwen2-72B。
在Qwen2发布后,Hugging Face联合创始人兼首席执行官Clement Delangue也很快在社交平台X上发帖表示,其开源大模型榜单迎来了新的第一。
许多国外的开发者也纷纷表示欢迎,"这个开源大模型就如同今天SpaceX成功发射的星舰一样重要!"一位网友评论称。
通义千问Qwen系列开源模型正在成为Meta的Llama系列大模型之外的另一选项,在国外开发者社区中也获得了较高的讨论度。据官方信息,通义千问Qwen系列模型在近一个月内的总下载量翻了一倍,已突破1600万次,全球开源社区出现了超过1500款基于Qwen二次开发的模型。
如果Meta是国外开源阵营的执旗者,那么国内则站着阿里云、腾讯等国内大厂以及百川智能、智谱AI等初创企业。
他们认为开源能够降低使用门槛,带动大模型生态的繁荣,大多采取的是开源和闭源模型并行的策略。阿里云此前除了开源1100亿参数的Qwen1.5-110B模型,还同时发布了闭源大模型通义千问2.5。
而大模型闭源的拥趸则认为,为了保持领先,选择闭源的企业会投入大量的成本在模型的质量和安全上,并祭出了一个强大的例子——采取完全闭源的OpenAI。
百度CEO李彦宏曾多次表示,大模型开源意义不大,闭源模型在能力上会持续地领先,而不是一时地领先,"开源模型会越来越落后"。
在这番发言后不久,Meta就推出了当时能力最强的开源模型Llama 3,具备8B和70B两个版本。
阿里云CTO周靖人在回应开闭源之争时曾指出,"Llama 3把竞争的水位拉得很高。坦诚地说,不是所有闭源公司的模型都能比得上开源模型,至少闭源模型要能超过开源模型水准,才有机会参与这样的讨论。"
在发布本次开源模型时,周靖人再次强调,坚持开源开放是阿里云的重要策略,阿里云希望让算力更普惠、让AI更普及。
除了这些上价值的口号之外,把先进的大模型开源对阿里云来说也有很多现实意义。
一方面,作为头部云厂商,阿里云具备充足的算力、通信网络等AI基础设施,能够支持开源大模型的研发和训练。另一方面,在"AI驱动、公共云优先"的策略下,阿里云希望通过开源模型吸引更多的企业和开发者,使用其供应的基础设施,带动其云计算业务的增长。
阿里巴巴集团董事长蔡崇信5月31日在上海举办的摩根大通中国峰会中谈及,"在业界,阿里巴巴可能是极少数同时拥有强大人工智能业务和领先云计算业务的公司之一。"他指出,人工智能与云计算的紧密结合至关重要。当用户在社区内使用开源人工智能工具时,他们自然需要计算资源,这也是阿里云计算收入得以增长的重要推动力。
因此,阿里云有足够的动力积极推动其开源模型为开发者所接受,以便加快其云计算业务的销售。
据阿里2024财年Q4及全年业绩,阿里云季度收入增长3%至255.95亿元,核心公共云产品收入实现两位数增长,AI相关云产品实现三位数增长。在业绩会上,管理层预计云业务下半年将恢复至两位数增长,主要受AI新产品的驱动。
上个月,火狐浏览器凭一个骚操作,把一堆用户都惹急了。但奇怪的是,这怎么看都是一个大新闻的事故,世超却没看到多少媒体报道。。。事情是这样。火狐浏览器有个夜间模式,打开会反...
2 GPT-4升级被曝引入Q*,推理/数学更强废话更少,竞技场重夺王位新版GPT-4是在Q*的输出上微调的? 在竞技场重回榜一的新版GPT-4 Turbo,成功再次踩中大家嗨点。 它此次的性能提升体现在数学、推理、代码上,而且输出内容废话更少。 最让大家感...
3 到了东南亚,拼多多才发现自己居然还不够野...把拼多多和东南亚摆在一起,很多人第一直觉一定是:最擅长做增长和下沉市场的拼多多肯定随便拿下啊。然而事实并非如此。TEMU 在日本和韩国上线亚洲试点成功后,几乎立马开始了东...
4 商汤升级“日日新5.0”大模型,对标GPT-4Turbo·“日日新5.0”采用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“...
5 卖得最火的 AI 硬件 Rabbit R1 首批体验出炉:还没干翻 app,被质疑造假两周前, Ai Pin 的第一批用户在体验产品过后,出奇地达成了一致评价:噱头大于实际,取代手机还为时过早。当时,Rabbit 创始人吕骋(Jesse Lyu)也没错过这个落井下石的大好机会,通过一...
6 ChatGPT新增临时聊天功能:对话不留痕迹5月2日消息,近日,OpenAI发布更新,为ChatGPT新增了“临时聊天”功能。为满足用户对隐私的进一步需求,OpenAI 引入了 " 临时聊天 " 功能。通过这一功能,用户可以与 Chat...
7 谷歌面临史上最大威胁!曝OpenAI将发布搜索引擎5月6日消息,据多家媒体近日报道,OpenAI正在计划一款基于其ChatGPT聊天机器人的大型产品——全新的搜索引擎。前Mila研究员、麻省理工讲师Lior S爆料称:"OpenAI即将...
8 首个中文原生DiT架构!腾讯混元文生图大模型宣布全面开源5月14日消息,今日,腾讯旗下混元文生图大模型(混元DiT,Diffusion Models with Transformers)宣布全面开源。目前已在Hugging Face、Github上发布,包含模型权重、推理代码、模型算...
9 都说谷歌被OpenAI狙击了,我怎么觉得它在狙苹果今天凌晨,谷歌的 I/O 2024 大会也如约而至了。。。发布会是在美国山景城开的,咱编辑部也派人去了现场,听身处前线的同事讲,不知道是不是 OpenAI 抢了风头的缘故,今年现场的氛围...
10 音乐发现和识别应用Shazam更新支持实时活动苹果今天在其免费的音乐发现和识别应用Shazam中,增加了对实时活动的支持。 Shazam的实时活动使用户在后台搜索音乐时保持最新状态,这在处理多任务或识别其他应用中的歌曲时特...
备案号:粤ICP备2023097408号 Copyright © 2020-2021 海南金游汇电子竞技有限公司 版权所有