以小小小小胜大，Google 最强小模型刚刚发布，手机也能跑

首页
头条导航

行情

资产管理

应用

钱包

矿池

媒体

技术服务

社区
7*24快讯
活动

报名中

已结束
专栏
关于我们

欧易交易所

全球顶流数字资产交易，流通强交易更安全。
MyToken

MyToken致力于满足用户对全球数字资产行情和资讯的全生态需求，是业内最具影响力的数字资产行情App。我们立志于为全球用户提供体验感最佳的一站式数字资产投资服务，呈现具有充分价值的内容资讯和社交体验，并集成更多深度投资工具。 MyToken提倡价值投资，推崇去中心化的设计理念和组织结构，作为区块链用户、投资者的桥梁，帮助用户更好更快地参与到区块链世界的变革中。
金色财经

国内的区块链行业媒体平台。
非小号

国内专业的数字货币行业大数据平台
区块链头条

未来已来，头条为你链接未来！区块链头条，每天为你带来及时的区块链资讯和专业的行业观察。
币众

一周读懂区块链！

爱范儿 2026/04/03 08:17

2175

「开放」和「开源」，并非一字之差。

Google 的 Gemma 系列发布已有两年，但开发者能下载、能本地运行，但用途受限，再分发受限，改了也不能随便传播。充其量说，这只能算「开放」，还达不到 AI 圈「开源」的标准。

Google DeepMind CEO Demis Hassabis

就在刚刚，Google 发布四款 Gemma 4 系列模型，支持 Apache 2.0 全面开源，其中最小的版本可以在树莓派上完全离线运行。Gemma 小模型，第一次真正意义上地落到了每个人手里。

以小小小小胜大

Gemma 4 共发布四个尺寸，底层技术与 Gemini 3 同源，覆盖从边缘设备到高性能工作站的硬件：

E2B / E4B：专为手机和 IoT 设备设计，与 Google Pixel 团队及高通、联发科深度合作优化。推理时分别仅激活 2B 和 4B 参数，以尽量节省内存和电量。

支持 128K 上下文窗口，具备图片、视频和原生音频输入能力，可在 Pixel 手机、树莓派、Jetson Orin Nano 上完全离线运行，延迟接近于零。Android 开发者现在可通过 AICore 开发者预览版提前体验 Agent Mode。

26B MoE：混合专家架构，推理时仅激活全部参数中的 3.8B，在保证极快推理速度的同时维持较高质量，Arena AI 文本评分达到 1441，位列开源模型第六。

31B Dense：追求极致原始性能，Arena AI 文本评分达到 1452，位列开源模型第三。未量化的 bfloat16 权重可在单张 80GB NVIDIA H100 上运行，量化版本支持消费级 GPU，为本地微调提供强力基础。

在能力层面，四款模型高度一致：均支持多步推理和复杂逻辑；原生支持函数调用、JSON 结构化输出和系统指令，可构建能与外部工具和 API 交互的自主 Agent；

支持图片和视频输入，擅长 OCR 和图表理解等视觉任务；预训练语言超过 140 种。26B 和 31B 的上下文窗口进一步扩展至 256K，可在单次提示中传入完整代码库或长文档。

基准测试的数字，能更直观地说明这一代的升级幅度。与上一代 Gemma 3 27B 相比，Gemma 4 31B 在数学推理基准 AIME 2026 上从 20.8% 跳升至 89.2%，代码能力基准 LiveCodeBench v6 从 29.1% 升至 80.0%，衡量 Agent 工具调用能力的 τ2-bench 则从 6.6% 大幅提升至 86.4%。

这三项数据尤为关键，因为它们直接对应推理、编程和 Agent 三个当下最核心的应用场景。

参数效率是另一个值得关注的维度。从「模型性能对比参数量」的散点图来看，Gemma 4 用 26B 和 31B 的体量，拿到了通常需要数百亿乃至千亿参数才能达到的 Elo 分数。

26B MoE 的 Arena AI 评分接近参数量约 15 倍的 Qwen3.5-397B-A17B，31B Dense 的评分则与体量在 600B 以上的 GLM-5 处于同一梯队。Google 将其概括为「单位参数智能密度前所未有」，至少数字显得有理有据。

边缘端模型同样值得关注。E2B 在多语言问答基准 MMMLU 上达到 60.0%，在科学知识基准 GPQA Diamond 上达到 43.4%，要知道，这仅仅是一个只激活 2B 参数、可以跑在手机上的模型。

相比之下，Gemma 3 27B 在 GPQA Diamond 上的得分是 42.4%，两者几乎持平。换句话说，手机上的 2B 模型，已经追上了上一代 270 亿参数的桌面模型。

在硬件生态层面，NVIDIA 与 Google 已就 Gemma 4 在 RTX GPU、DGX Spark 个人 AI 超级计算机及 Jetson Orin Nano 上的推理优化展开合作。

NVIDIA Tensor Core 和 CUDA 软件栈为 Gemma 4 提供了开箱即用的高吞吐、低延迟支持。本地 Agent 应用 OpenClaw 也已适配最新模型，可调用用户本地文件和应用上下文自动化执行任务。

从「开放」到「开源」，打开另一种可能性

理解这次发布，需要先搞清楚 Gemma 和 Gemini 的关系。两者基于同一套研究和技术体系构建，区别在于 Gemini 是订阅制的闭源产品，Gemma 则是可以免费下载、本地运行的开放模型。

Gemma 系列历代产品一直使用 Google 自有条款授权。开发者虽然可以下载和本地运行，但用途和再分发受到限制。

现在 Gemma 4 正式切换至 Apache 2.0 协议。在这套许可证下，开发者可以将模型用于任何目的，包括个人、商业和企业用途，无需支付版税，也无任何用途限制，修改和再分发同样自由。

Apache 2.0 还内置了专利保护机制：贡献者的专利自动授权给用户，若用户反过来以专利侵权起诉他人，则自动丧失使用授权。这套双向条款为企业级用户提供了额外的法律保障。

这次开源的实质意义在于，Gemma 4 现在可以合法打包进产品、服务和硬件设备中一并交付。对于医疗、金融等有数据主权或合规要求的行业用户，完全本地运行意味着数据不必上传云端，同时又能获得前沿的 AI 能力。

Hugging Face 联合创始人兼 CEO Clément Delangue 将此次授权切换称为「一个重要的里程碑」。自 2024 年 2 月首代发布至今，Gemma 系列总下载量已超 4 亿次，社区衍生变体超过 10 万个。

现在，模型权重已经上架 Hugging Face、Kaggle 和 Ollama，Transformers、TRL、vLLM、llama.cpp、MLX、Unsloth、SGLang、Keras 等主流框架均已于发布当天提供支持。

https://huggingface.co/google/gemma-4-31B-it

本地部署可通过 Ollama 或 llama.cpp 配合 GGUF 格式权重快速上手，Unsloth Studio 同步提供量化模型的微调和部署支持。如需云端扩展，Google Vertex AI、Cloud Run 和 GKE 同步可用。

以 Gemma 4 为代表的小模型有着更深远的意义，因为它重新回答了一个基础问题：AI 应该在哪里运行。

过去两年，这个问题的答案几乎是默认的：

数据中心。用户通过网络接口调用云端模型，数据必须上传，使用依赖连接，成本由服务商定价。这套模式在消费场景里运转尚可，但对数据主权有要求的行业，比如医疗、金融、工业，始终是一道难以逾越的门槛。

Gemma 4 提供了另一种可能。

手机、树莓派、没有外网的工厂终端，都可以在本地完成完整的模型推理。数据不离开设备，决策不经过云端。Apache 2.0 的授权则进一步打开了落地空间：模型可以合法打包进硬件产品，预装进行业设备，不再受限于调用协议和数据出境的合规约束。

能力层面的数字也印证了这条路的可行性。E2B 在科学知识基准 GPQA Diamond 上的得分，已经与上一代 270 亿参数的桌面模型基本持平，而它推理时只激活 20 亿参数，可以完全离线跑在手机上。

「更便宜」或「更方便」已经不足以描述这个变化，它更接近于一次覆盖范围的扩张，AI 能力开始有条件真正进入那些长期被排除在外的场景。

操作系统的普及经历过类似的过程：从专业机构的专用工具，逐渐嵌进每一台个人设备，直到人们不再意识到它的存在。AI 离那个阶段还很远，工程、交互、可靠性上的问题都还没有完整的答案，但可以跑在任意设备上，一定是这条路上最基础也是最重要的一步。

本文来自微信公众号“APPSO”，作者：发现明日产品的APPSO

声明：本文观点仅代表作者本人，绝不代表区块链头条官方赞同其观点或证实其描述。

提示：投资有风险，入市须谨慎。本资讯不作为投资理财建议。

热门快讯更多

14:14

FloorForge 正式上线：重塑 BNB Chain 资产发行与链上金融新范式

2026 年 4 月 29 日，基于 BNB Chain 构建的新一代发币与链上金融协议 FloorForge 正式上线，旨在重塑链上资产从发行、流转到价值沉淀的全周期路径，突破传统 Launchpad 的单一发行逻辑。

FloorForge 集“发币 + 交易 + 地板价 + 协议储备 + 链上借贷”于一体，通过地板价机制、独立储备池、协议自有流动性（POL）以及无清算借贷体系，为链上资产提供结构性支撑与更稳定的运行环境。

项目面向 MEME 用户、DeFi 策略参与者及项目方，构建“发行即市场”的资产系统，实现从高波动投机向结构化金融体系的升级。

上线后将于 4 月 30 日 20:00 在币安、火币及 Twitter Space 三平台同步开启 AMA 直播，现场解答核心机制，并发放 200 USDT 空投福利。

官网：floorforge.org | X：@FloorForge

利好36

利空2

18:44

单币模型失效？OLAFI三层结构或于5月上线引发新一轮关注

在Web3持续演化的背景下，单一代币模型的增长瓶颈逐渐显现。市场对更具稳定性与持续性的经济结构需求不断提升。

在此趋势下，OLAFI提出由LA、LF、GR构成的三层结构模型，通过流量承接、结构放大与价值沉淀实现功能拆分与协同运作，从而提升运行效率，增强整体经济韧性与缔造可持续性。

据悉，OLAFI计划于2026年5月正式上线，其结构化机制与多层循环设计，将为链上经济从“叙事驱动”走向“架构驱动”，为行业提供长期价值承载力的发展新路径。

利好36

利空3

09:20

《预见 Foresee》将于4月10日全球公测，开启“判断力即资产”新纪元

【2026年4月10日·哈桑特区讯】俄罗斯联邦政府立项批准、哈桑特区持牌预测平台《预见 Foresee》将于 2026年4月10日16:00（VLAT 时间）正式开启全球公测。同步时间为：MSK 09:00、CST 14:00。

据悉，《预见 Foresee》依托俄罗斯联邦政府背书及哈桑特区监管框架，底层部署于 BNB Smart Chain，以“判断力即资产”为核心理念，致力于打造新一代链上预测平台。

官方表示：“在《预见 Foresee》，判断力与影响力不再只是能力，而是可被沉淀的资产；游戏中的每一种结局，都通向价值。”

利好36

利空5

热门新闻更多>

Web3 中的游戏治理（一）: 什么是游戏治理及利与弊

头条有约第2期 | Dan：BTCC 9年追梦，乘风破浪

2020-07-08
头条有约第4期 | 黄连金：DeFi的整体生态仍在扩张

2020-09-18
头条有约第3期 | Andy：Filecoin有机会成为比肩比特币，甚至超越比特币

2020-07-15
OKEx关于开放提币功能等相关事宜的公告

2020-11-20
我校举行区块链+信用大数据高峰论坛暨福建移动-华侨大学5G联合创新实验室、华大-中盈区块链联合研究中心揭牌仪式

2020-11-04

版权声明

1、本网站刊载的所有内容，包括但不限于文字报道、图片、视频、图表、标志\标识、商标、版面设计、专栏目录与名称、内容分类标准等，均受我国相关法律及适用之国际公约中有关著作权、商标权、专利权以及或其它财产所有权法律的保护，相应的版权或许可使用权均属本网站所有。

2、未经书面授权或许可，任何媒体、网站及个人不得转载、复制、重制、改动、展示或使用界面网站的局部或全部的内容或服务。如果已转载，请自行删除。同时，我们保留进一步追究相关行为主体的法律责任的权利。

3、希望我们与之合作的各媒体，敬请签订有偿使用许可合同。

4、已经本网站授权使用的，应按照授权所约定条款使用。

5、本网站摘录或转载的属于第三方的信息，目的在于传递更多信息，并不对其真实性负责，转载信息版权属于原媒体及作者。如擅自转载使用的，法律责任自行负担。

6、凡违反上述声明者，我们必将依法追究其法律责任。

商务合作

手机:13255904767

微信:blocktop001

商务邮箱

邮箱：313004786@qq.com

企业生态

区块链头条

纷智共识机

FINWISE纷智峰会
关于我们

头条介绍

商务合作

版权声明
联系我们

0592-6600592

info@ababtc.com

厦门市湖里区

友情链接金色财经雷電財經巴比特纷智峰会西瓜财经 nft数字藏品左耳文化元宇宙投融邦

关注公众号

官方微博