关于网站建设项目实训报告,安卓app开发模板,百度账号中心,如何做网站霸屏大家好#xff0c;我是极智视界#xff0c;欢迎关注我的公众号#xff0c;获取我的更多前沿科技分享 邀您加入我的知识星球「极智视界」#xff0c;星球内有超多好玩的项目实战源码和资源下载#xff0c;链接#xff1a;https://t.zsxq.com/0aiNxERDq 12 月 1 日阿里开源… 大家好我是极智视界欢迎关注我的公众号获取我的更多前沿科技分享 邀您加入我的知识星球「极智视界」星球内有超多好玩的项目实战源码和资源下载链接https://t.zsxq.com/0aiNxERDq 12 月 1 日阿里开源了 72B 和 18B 大模型以及音频大模型 Qwen-Audio再加上之前八月份、九月份开源的 7B 和 14B 大模型号称是 全尺寸开源。我也去 Github 上瞅了一眼通义应该确实是 兜库底 了所有规格的模型都开源了。 对于这个事情我的第一反应是难得啊对于阿里这种技术相对封闭的公司来说。但是仔细想想目前对于大模型来说开不开源真的很重要吗其实是需要打个问号的除非你 OpenAI 的 GPT-4 开源不然业界应该很难激起过多的浪花因为大家都见多不怪了。现在对于大模型真正卡脖子地方是在 算力 和 数据 上而不在 算法 上。以前是这三驾马车都很重要然后算法可能会更加重要一些。但是现在大模型时代则不太一样特别是在美国芯片禁令的情况下主要矛盾已经明显倾向于对于算力的需求上。现在国内很多大模型从算法实现角度都可以用 套壳 LLaMA 来达到 自研大模型 商业化的目的这个时候你通义开不开源其实并不太重要。而说到 套壳就又是另外一个有意思的话题了这里不过多展开。 现在主要矛盾点在于我要有足够的算力、足够高质量的数据来进行微调甚至是从头训练。对于很多大模型厂商来说区别只是在我选 LLaMA 来微调还是选通义大模型来微调而相信大多还是会选 LLaMA。这其实可以类比到手机领域安卓大家都可以用很多时候有安卓就够了你鸿蒙开源对于小米、对于 vivo 的操作系统研发意义大吗我小米会把自己手机操作系统切到基于鸿蒙的吗 (可能确实有参考意义比如对于小米澎湃 OS 的研发但是对于大多数厂商来说还是用安卓就够够的了)大家更加在意的是能够拥有性能更加好的芯片、算力更加好的处理器比如前段时间经常上热搜的全大核天玑 9300这才是核心竞争力。 虽然 (是反转没错了)在大家有 LLaMA 可选的情况下通义的开源意义确实不大。但是开源总能赢得好名声这点毋庸置疑何况通义开源了自己全规格的模型其开源的 70B 大模型也是目前开源大模型中最大规模的可以说 诚意满满对于博一个好名声应该是不难的这是 名。
然后咱们来说说 利通义大模型是开源了大家要用、要微调得要有算力吧算力哪里来答案就是阿里云你品你细品。来继续分析阿里还有个号称国产 HaggingFace 的魔塔 ModelScope要用开源的通义你就得上魔塔而魔塔部署在哪里呢魔塔的算力来源于哪里呢答案依旧是阿里云你品你细品。阿里的这招太 精明 了真的是既想要名也想要利啊。 从这个角度来说其实在 12 月 1 日阿里宣布全量开源通义前问大模型的时候阿里已经彻底换赛道了已经是不想跟大家玩大模型了已经不再是 百模大战 中的一员了。未来百模大战 肯定会继续而阿里更加聪明烧钱去做大模型效果嘛打不过 GPT-4落地商业化嘛又难竞争对手又像疯了一样的涌进来换个赛道躺着挣钱它不香嘛。这大概率也是在学英伟达、特别是在学 AWS。提供付费算力这才是大模型时代正确的挣钱的方式啊这些才是大模型时代挣麻了的企业啊。继续给阿里支招继续开源数据集让大家在阿里云上训练(烧钱)彻底没有技术上的障碍而变成一个愿不愿意花钱的问题。 阿里云是懂计算的。计算无法计算的价值数钱数到手抽筋。 【极智视界】
《解读 | 阿里通义千问模型全尺寸开源 诚意满满背后的名与利》