数据科学家Max Woolf：大语言模型并非万能，合理使用才能事半功倍

23次阅读

共计 1035 个字符，预计需要花费 3 分钟才能阅读完成。

大语言模型（LLM）究竟有何用武之地？从撰写文章到编程，甚至提供陪伴，它似乎无所不能。然而，拥有丰富 LLM 使用经验的 Max Woolf 却认为，我们或许并不需要频繁依赖它们。

Max Woolf 是 BuzzFeed 的高级数据科学家，专注于 AI/ML 工具及开源项目研究，他对生成式 AI 持批判态度。在他看来，所谓的 agent 和 MCP 不过是 2022 年 ReAct 论文提出的‘工具范式’的新包装；至于使用 Claude Code 或 Cursor 等编码 agent 进行氛围编码，他甚至提不起兴趣。

Max 指出，LLM 只是工具箱中的一个工具，具体是否适用取决于使用的时间和场合。有时候它可以发挥巨大作用，有时却可能适得其反。

在一篇近期发布的博客中，他详细探讨了为何身为经验丰富的 LLM 用户，自己并不常使用 LLM。他提到，自己在过去十年间一直在研究和开发文本生成工具，从 char-rnns 到基于 GPT- 3 的实验，再到如今的 ChatGPT 和更多 API 实验。尽管他不认为自己是 LLM 领域的顶级专家，但他对克服 token 预测模型缺陷积累了丰富经验。

为了从 LLM 中获取最佳效果，Max 尝试了多种方法，其中最著名的技巧是‘提示工程’。通过精心设计提示词，引导模型生成符合特定约束的输出，这种方法确实在提升输出质量和模型遵循提示的程度方面效果显著。

每当同事问他为何他们的 LLM 输出不如预期时，他都会建议加强提示工程，这几乎总能解决问题。虽然提示工程本身并不受欢迎，但它已成为认真使用 LLM 者的必备技能。

在 BuzzFeed 的工作中，Max 利用 LLM 解决了许多实际问题。例如，他编写脚本为数千篇文章分配分类标签，仅用一个小时就完成了概念验证。类似地，他还利用 LLM 帮助识别文章语义集群并生成标题描述。

此外，LLM 还能用于文本嵌入，用于识别相似文章和构建推荐系统。尽管如此，Max 并未用 LLM 撰写这篇博客，因为他认为自己的写作风格过于独特，LLM 难以模仿。

Max 确实会用 LLM 编写代码，尤其是在确认它能提升效率的情况下。他通过向 Claude Sonnet 提问解决了许多编码难题，但对复杂问题仍持谨慎态度。

尽管 LLM 在编写代码方面有一定优势，但对于大规模数据分析和数据可视化，他更倾向于使用 R 和 ggplot2，且不相信 LLM 能胜任这些任务。

总之，Max 认为 LLM 只是工具之一，关键在于如何合理使用。正如他在工作中所实践的，只有在适当场景下使用 LLM 才能事半功倍。

正文完

人工智能代码生成大语言模型工具范式提示工程数据科学文本嵌入理性使用生成式AI 编码助手

发表至： AI

2025-05-28

0

微软开源Phi-4推理模型：小而强，反卷出圈

AI 破 2000 年前「上古卷轴」，古卷标题首次现形

Mistral Medium 3发布，性价比比肩Claude 3.7

DeepSeek引领开源AI浪潮：边缘突破与知识革新

郑志刚引领K11逆袭家族产业迎来新变局

数据科学家Max Woolf：大语言模型并非万能，合理使用才能事半功倍

理性看待 LLM

提示工程的重要性

LLM 的实际应用

编码辅助的价值与局限

老旧高星酒店为何竞争不过经济型酒店？

元宇宙热潮：技术革新还是商业泡沫？

深圳无人机科技引领全球新潮流

中安华邦获投资，安全生产培训数智化迎新机

海口崛起：从“小透明”到国际演艺新星

斯凯沃创投：大湾区新锐消费产业投资的引领者

鸡西发展困境与转型之路：避免重蹈鹤岗覆辙

2021创投年终盘点：机遇与挑战并存的投资年份

深圳崛起：通用机场密度第一城的背后

2021年中国投融资市场全景解析

硅谷金融巨头SoFi系统性性丑闻曝光 CEO遭董事会罢免

编程奇才楼天城携自动驾驶操作系统挑战行业格局

小程序极限开发实战手记

初创企业生存法则：破解90%创业公司夭折的现金流密码

Instagram崛起之路：三次错失亿万财富的创业启示