共计 2048 个字符,预计需要花费 6 分钟才能阅读完成。
AI 的聊天功能常被网友调侃为“人工智障”,但也有人会与 AI“交心”。如今,AI 工具越来越“聪明”,人们对其依赖度和结合度不断提高。中国海量的 AI 工具形成了三条不同的前进路线,DeepSeek、夸克和豆包正是三类工具的代表产品。
天下三分
2025 年堪称 AI 元年。据 QuestMobile 数据,截至 2025 年 2 月,AI 原生 App 月活跃用户(MAU)突破 2.4 亿,较去年同期净增超 1.15 亿。在商业领域,2024 年中国 AI 核心产业规模达 5784 亿元,同比增长 13.9%;到 2029 年,这两个数字将分别攀升至 1 万亿元和 32.1%。
DeepSeek、夸克和豆包月活均居 Top 级别。DeepSeek 是国内 AI 原生 App 排名第一的软件,今年 3 月数据显示月活达 1.94 亿;夸克同期月活达 1.48 亿,去年暑期峰值月活接近 2 亿;豆包月活从 2024 年的 173 万增长至今年 3 月的 1.1 亿,增速达 35 倍。
三条路线,三个方向
DeepSeek 专注底层技术突破,是中国 AGI 领域代表,其核心竞争力体现在通用大模型研发与开源生态构建。它与其他 AI 厂商不同,更重技术而非商业化。提到 DeepSeek,人们最先想起推理模型 R1,其在数学推理、代码生成和复杂任务处理上有突破性进展,数学任务性能可与 OpenAI 的 O1 媲美。
传统大模型存在知识精细度不足、领域适配困难、复杂推理能力缺失、算力消耗与部署成本过高等问题,而 DeepSeek R1 通过混合专家架构(MoE)、强化学习和开源生态解决了这些问题。技术架构上,强化学习驱动的高效推理带来大模型训练的“规模效应”革命,优化 MoE 架构降低 30% 算力消耗,回答专业领域问题时延迟更低。
DeepSeek R1 首次以长链逻辑与思维可视化方式展现推理模型特性,是全球首个展示完整推导过程的推理模型。在推理能力加持下,其复杂任务分解能力大大提升,解答高考数学题时会逐步呈现概率计算路径,便于用户发现模型思考漏洞。DeepSeek 的技术路线使其更擅长自然语言处理和复杂推理类问题,在代码生成和编程辅助上能力极强,对金融、银行和科研机构等能提高数据分析效率,推动 AI 技术普惠化。
夸克把 AI 搜索作为工具核心,阿里将其定位为“AI 普惠平台”,依托阿里生态实现“搜索 + 生成”双向增强,确立“AI+ 搜索”“AI+ 办公”“AI+ 教育”三大主线。夸克在“提升搜索效果”上下功夫,能搜到几秒前发生的大新闻,依托阿里云通义大模型与搜索生态深度融合,实现 10 秒每次的更新频率,抓取新消息延迟降低到 3 分钟以内。
夸克的“超级框”整合了 AI 对话、深度搜索、内容生成(PPT、文案)、学术研究等功能,简化用户搜索思考成本和操作逻辑。它拥有相对更低的 AI 幻觉,设置三审三校机制,医疗、法律等专业领域生成需经行业专家审核,结合知识图谱校验,医疗问答错误率控制在 5% 以下。
夸克 AI 能力依托阿里的通义千问大模型,虽是非推理类传统大模型,但能力较强。在基准测试平台 Chatbot Arena 的评测榜单中,通义 Qwen2.5-Max 超越 DeepSeek-V3、Open AI o1-mini 和 Claude-3.5-Sonnet 等模型,以 1332 分位列全球第七名,是中国非推理模型中最强的。夸克从通义千问获得多模态融合能力,在一些逻辑推理场景中能发挥通义千问数学能力强的优点。
豆包被字节定位为“全民 AI 入口”,主攻消费级市场,创意生成和社交娱乐是最大卖点,多模态交互是灵魂。它代表中国 AI 工具在 C 端场景的深度渗透,功能比 DeepSeek 多,生图效果比夸克好。字节还为其安排了梦 App 和可灵,分别主打轻量级视频和图片生成、面向专业级企业用户。
豆包过去依靠 Transformer 与扩散模型结合的基础架构,结合语音 - 文本联合建模和视觉生成技术的多模态技术融合,提供多模态功能。4 月 17 日,豆包发布全新的 1.5 深度思考模型,采用 MoE 架构,总参数 200B、激活参数 20B。该模型强化了数学、编程、科学和推理能力,测试表现超过 DeepSeek-R1、QwQ-32B 等国产推理模型,与 OpenAI o1、o3-mini-high 等模型能力相仿。
随着架构优化、资源分配优化和推理效率提升,深度思考大模型让豆包的图片生成、视频生成能力进一步升级,支持“边想边搜”“视觉理解”等实用能力,豆包文生图 3.0 将生成图片的最大分辨率提高到 2k 级别。依托字节系应用的海量流量,豆包预计月活还能持续创新高。
AI 围城
去年主流 AI 工具还几乎不可用,如今各种 AI 涌现,改变了人们的生活。但 AI 工具泛滥带来 AI 幻觉问题,如 DeepSeek R1 的事实性测试幻觉率高达 22.33%,一些由幻觉产生的“AI 胡说八道”又会成为语料,污染中文互联网。
美国有男孩在聊天机器人程序“怂恿”下自杀,这引发人们对人类与 AI 关系的担忧。当 AI 越来越智能,聊天机器人越发像人,人类身处由 AI 构筑的围城中,把作品、言论、思想喂给 AI 作为语料,把最后的心情、感觉、心愿留给 AI,人类与 AI 和人类之间的关系变得微妙起来。