干货·28 May 2026

ChatGPT 不是 AI，它只是你认识的那个 AI

SME 老板只用 ChatGPT，就像 1995 年只用雅虎搜索一样。问题不在于模型，问题在于你不知道工具是被什么"水"养大的——而水的来源，决定了它最擅长什么。

An old bespectacled merchant at a misty harbor inspecting four different sailing ships tied to the same dock, each ship's sails made from different materials — newspaper, academic scrolls, chat letters, and tweets fluttering in the wind — with a single guiding star labeled "training data" above them in sumi-e ink style.

前阵子和一个做工程贸易的老朋友吃饭，他很得意地告诉我，他现在公司报价单、邮件、营销文案全都用 ChatGPT 写，"省了半个文员的钱"。我问他试过别的没有，他说："还有别的？不都是一样吗？"

这句话让我想起 1995 年。那年我在中环一个做进出口的朋友办公室里，他指着电脑跟我炫耀："这个叫 Yahoo，什么都能查。"我问他试过 AltaVista 没，他说："不都一样吗，都是上网。"五年后，他还在用 Yahoo，别人已经在用 Google 做 SEO 拿客户了。

工具的代差，从来不是从"有没有"开始拉开的，是从"你以为只有一种"开始拉开的。

今天的 SME 老板，绝大多数停留在"AI = ChatGPT"这个认知层。但你随便走进新加坡 Block 71 那一带，那些一年内做到盈利的小公司，没有一个是只用 ChatGPT 的。他们在用 Claude 写代码、用 Perplexity 做尽调、用 Grok 看市场情绪、用本地模型处理客户数据。这不是炫技，这是分工。

讲一个老道理：工具的脾气，由它喝的水决定。

九十年代初，做金融数据的有两家——Bloomberg 和 Reuters。表面上长得差不多，黑底绿字一堆数字。但 Bloomberg 的数据底层是从交易员、做市商那里抓来的实时报价，所以做外汇、做债券的人离不开它；Reuters 底层是新闻通讯社几十年的记者网络，所以做宏观、做研究的人偏爱它。一个交易员要是只用 Reuters，他会慢半拍；一个研究员要是只用 Bloomberg，他会缺少叙事。用错工具，不是工具不行，是你不知道它是被什么喂大的。

再往前一点，七十年代日本制造业崛起的时候，丰田用的是石川馨那套统计质量管制，索尼用的是盛田昭夫那套消费者直觉，松下用的是"自来水哲学"那套规模铺货。三家都是"日本制造"，但底层方法论完全不一样。一个做精密零件的中小企业老板，要是照搬松下那套铺货逻辑，三年之内一定倒闭。

工具是有"出身"的。出身决定了它擅长什么、不擅长什么。这条规律，老张称之为 "水土定律" —— 模型是它训练数据的儿子，不是它的爹。

为什么 AI 模型会有这么明显的"性格差异"？因为机器学习的本质就是模仿。你给它看一万亿个字，它学到的就是那一万亿个字里的人是怎么思考的。

我用最粗的笔触给你画一下今天主要几个模型的"出身"，你听完就懂为什么不能只用一个：

ChatGPT (OpenAI) —— 喝的是互联网杂菜汤。它读了 Reddit、维基百科、新闻、博客、教科书、网络小说……什么都有一点。所以它最像一个"什么都懂一点的客服小哥"，态度好、不得罪人、会哄你开心。这是它能成为大众产品的原因，也是它在专业场景里经常不够锐利的原因。它的目标是让你不取消订阅，不是让你拿到最准的答案。

Claude (Anthropic) —— 喝的是相对偏学术、偏长文本、偏写作训练的水。Anthropic 的创始人 Dario Amodei 当年在 OpenAI 内部就是搞 alignment 的，他这帮人很 nerdy，做出来的模型也很 nerdy。所以 Claude 写长文、做推理、写代码（特别是 Claude Code 这条线）明显比 ChatGPT 老实——它不会乱讨好你，会说"你这个想法有问题"。今年硅谷一票 vibe-coding 起家的小公司，几乎清一色用 Claude，不是偶然。

Gemini (Google) —— 喝的是 Google 的水，搜索索引、YouTube 字幕、学术论文、Google Books。它的强项是"事实检索"和多模态，弱项是它有点像 Google 本身，臃肿、保守、答非所问的时候很多。

Grok (xAI) —— 喝的是 X（前 Twitter）的水。所以它最懂当下的市场情绪、网络黑话、谁在骂谁。你要做舆情、看一个币种或者一个股票的散户情绪，Grok 比 ChatGPT 准得多，因为 ChatGPT 训练数据有截止日期，而 Grok 是泡在推文里长大的。

Llama (Meta) —— 喝的是开源加上 Meta 自己的社交数据。它的最大价值不是它本身有多强，而是它是开源的，你可以下载下来在自己服务器上跑。对那些有客户隐私顾虑的 SME，这是唯一选项。

DeepSeek / Qwen (中国系) —— 喝的是中文互联网 + 大量代码。处理中文、处理东南亚华人客户的语境，这两家比美国模型自然得多。如果你做中国客户生意，不试一下是亏的。

看明白了吗？没有"最好的 AI"，只有"最对口的 AI"。

回到你这个开茶餐厅、做贸易、做小服务公司的 SME 老板。你不用学 Claude Code，不用懂什么 transformer 架构。但你要知道一件事——根据任务派工具，不要根据习惯派工具。

给你三个分类，照着用就行：

第一类：对外的、要哄人的、要安全的内容。 比如客户邮件、营销文案、社交媒体帖子、公司介绍。用 ChatGPT 就够了。它就是被训练来取悦人的，干这个活它最顺手。你让 Claude 写营销文案，它会写得像学术论文，没人想看。

第二类：要动脑、要严谨、要不被骗的内容。 比如合同条款分析、商业计划书、财务模型逻辑、代码、报告。用 Claude。它会跟你顶嘴，会说"你这个假设站不住脚"，这正是你需要的。一个会哄你的工具，在做决策的时候是有毒的。

第三类：要新鲜、要市场感、要知道"现在大家在想什么"的内容。 比如某个行业的最新动态、某个产品的口碑、某个地区的消费情绪。用 Grok 或者 Perplexity。ChatGPT 的训练数据可能是去年的，你拿去年的情绪做今年的决定，是要亏钱的。

一个具体的下一步： 这周，挑一个你过去一个月用 ChatGPT 做过的任务——任何一个——把同样的 prompt 复制粘贴到 Claude 里跑一遍，再到 Grok 里跑一遍。三个答案摆在你面前对比。你会立刻明白我今天在说什么，比读十篇文章都管用。Claude 和 Grok 都有免费版，花不了你一分钱，花你二十分钟。

最后再说一遍那颗星：模型是它训练数据的儿子。搞清楚它喝的是什么水，你就知道它能给你端出什么菜。

—— 老张

完