共计 1035 个字符,预计需要花费 3 分钟才能阅读完成。
大语言模型(LLM)究竟有何用武之地?从撰写文章到编程,甚至提供陪伴,它似乎无所不能。然而,拥有丰富 LLM 使用经验的 Max Woolf 却认为,我们或许并不需要频繁依赖它们。
Max Woolf 是 BuzzFeed 的高级数据科学家,专注于 AI/ML 工具及开源项目研究,他对生成式 AI 持批判态度。在他看来,所谓的 agent 和 MCP 不过是 2022 年 ReAct 论文提出的‘工具范式’的新包装;至于使用 Claude Code 或 Cursor 等编码 agent 进行氛围编码,他甚至提不起兴趣。
理性看待 LLM
Max 指出,LLM 只是工具箱中的一个工具,具体是否适用取决于使用的时间和场合。有时候它可以发挥巨大作用,有时却可能适得其反。
在一篇近期发布的博客中,他详细探讨了为何身为经验丰富的 LLM 用户,自己并不常使用 LLM。他提到,自己在过去十年间一直在研究和开发文本生成工具,从 char-rnns 到基于 GPT- 3 的实验,再到如今的 ChatGPT 和更多 API 实验。尽管他不认为自己是 LLM 领域的顶级专家,但他对克服 token 预测模型缺陷积累了丰富经验。
提示工程的重要性
为了从 LLM 中获取最佳效果,Max 尝试了多种方法,其中最著名的技巧是‘提示工程’。通过精心设计提示词,引导模型生成符合特定约束的输出,这种方法确实在提升输出质量和模型遵循提示的程度方面效果显著。
每当同事问他为何他们的 LLM 输出不如预期时,他都会建议加强提示工程,这几乎总能解决问题。虽然提示工程本身并不受欢迎,但它已成为认真使用 LLM 者的必备技能。
LLM 的实际应用
在 BuzzFeed 的工作中,Max 利用 LLM 解决了许多实际问题。例如,他编写脚本为数千篇文章分配分类标签,仅用一个小时就完成了概念验证。类似地,他还利用 LLM 帮助识别文章语义集群并生成标题描述。
此外,LLM 还能用于文本嵌入,用于识别相似文章和构建推荐系统。尽管如此,Max 并未用 LLM 撰写这篇博客,因为他认为自己的写作风格过于独特,LLM 难以模仿。
编码辅助的价值与局限
Max 确实会用 LLM 编写代码,尤其是在确认它能提升效率的情况下。他通过向 Claude Sonnet 提问解决了许多编码难题,但对复杂问题仍持谨慎态度。
尽管 LLM 在编写代码方面有一定优势,但对于大规模数据分析和数据可视化,他更倾向于使用 R 和 ggplot2,且不相信 LLM 能胜任这些任务。
总之,Max 认为 LLM 只是工具之一,关键在于如何合理使用。正如他在工作中所实践的,只有在适当场景下使用 LLM 才能事半功倍。