南洋老钱
干货·

ChatGPT 不是 AI,它只是你认识的那个 AI

SME 老板只用 ChatGPT,就像 1995 年只用雅虎搜索一样。问题不在于模型,问题在于你不知道工具是被什么"水"养大的——而水的来源,决定了它最擅长什么。

An old bespectacled merchant at a misty harbor inspecting four different sailing ships tied to the same dock, each ship's sails made from different materials — newspaper, academic scrolls, chat letters, and tweets fluttering in the wind — with a single guiding star labeled "training data" above them in sumi-e ink style.

前阵子和一个做工程贸易的老朋友吃饭,他很得意地告诉我,他现在公司报价单、邮件、营销文案全都用 ChatGPT 写,"省了半个文员的钱"。我问他试过别的没有,他说:"还有别的?不都是一样吗?"

这句话让我想起 1995 年。那年我在中环一个做进出口的朋友办公室里,他指着电脑跟我炫耀:"这个叫 Yahoo,什么都能查。"我问他试过 AltaVista 没,他说:"不都一样吗,都是上网。"五年后,他还在用 Yahoo,别人已经在用 Google 做 SEO 拿客户了。

工具的代差,从来不是从"有没有"开始拉开的,是从"你以为只有一种"开始拉开的。

今天的 SME 老板,绝大多数停留在"AI = ChatGPT"这个认知层。但你随便走进新加坡 Block 71 那一带,那些一年内做到盈利的小公司,没有一个是只用 ChatGPT 的。他们在用 Claude 写代码、用 Perplexity 做尽调、用 Grok 看市场情绪、用本地模型处理客户数据。这不是炫技,这是分工。

讲一个老道理:工具的脾气,由它喝的水决定

九十年代初,做金融数据的有两家——Bloomberg 和 Reuters。表面上长得差不多,黑底绿字一堆数字。但 Bloomberg 的数据底层是从交易员、做市商那里抓来的实时报价,所以做外汇、做债券的人离不开它;Reuters 底层是新闻通讯社几十年的记者网络,所以做宏观、做研究的人偏爱它。一个交易员要是只用 Reuters,他会慢半拍;一个研究员要是只用 Bloomberg,他会缺少叙事。用错工具,不是工具不行,是你不知道它是被什么喂大的。

再往前一点,七十年代日本制造业崛起的时候,丰田用的是石川馨那套统计质量管制,索尼用的是盛田昭夫那套消费者直觉,松下用的是"自来水哲学"那套规模铺货。三家都是"日本制造",但底层方法论完全不一样。一个做精密零件的中小企业老板,要是照搬松下那套铺货逻辑,三年之内一定倒闭。

工具是有"出身"的。出身决定了它擅长什么、不擅长什么。这条规律,老张称之为 "水土定律" —— 模型是它训练数据的儿子,不是它的爹

为什么 AI 模型会有这么明显的"性格差异"?因为机器学习的本质就是模仿。你给它看一万亿个字,它学到的就是那一万亿个字里的人是怎么思考的。

我用最粗的笔触给你画一下今天主要几个模型的"出身",你听完就懂为什么不能只用一个:

ChatGPT (OpenAI) —— 喝的是互联网杂菜汤。它读了 Reddit、维基百科、新闻、博客、教科书、网络小说……什么都有一点。所以它最像一个"什么都懂一点的客服小哥",态度好、不得罪人、会哄你开心。这是它能成为大众产品的原因,也是它在专业场景里经常不够锐利的原因。它的目标是让你不取消订阅,不是让你拿到最准的答案。

Claude (Anthropic) —— 喝的是相对偏学术、偏长文本、偏写作训练的水。Anthropic 的创始人 Dario Amodei 当年在 OpenAI 内部就是搞 alignment 的,他这帮人很 nerdy,做出来的模型也很 nerdy。所以 Claude 写长文、做推理、写代码(特别是 Claude Code 这条线)明显比 ChatGPT 老实——它不会乱讨好你,会说"你这个想法有问题"。今年硅谷一票 vibe-coding 起家的小公司,几乎清一色用 Claude,不是偶然。

Gemini (Google) —— 喝的是 Google 的水,搜索索引、YouTube 字幕、学术论文、Google Books。它的强项是"事实检索"和多模态,弱项是它有点像 Google 本身,臃肿、保守、答非所问的时候很多。

Grok (xAI) —— 喝的是 X(前 Twitter)的水。所以它最懂当下的市场情绪、网络黑话、谁在骂谁。你要做舆情、看一个币种或者一个股票的散户情绪,Grok 比 ChatGPT 准得多,因为 ChatGPT 训练数据有截止日期,而 Grok 是泡在推文里长大的。

Llama (Meta) —— 喝的是开源加上 Meta 自己的社交数据。它的最大价值不是它本身有多强,而是它是开源的,你可以下载下来在自己服务器上跑。对那些有客户隐私顾虑的 SME,这是唯一选项。

DeepSeek / Qwen (中国系) —— 喝的是中文互联网 + 大量代码。处理中文、处理东南亚华人客户的语境,这两家比美国模型自然得多。如果你做中国客户生意,不试一下是亏的。

看明白了吗?没有"最好的 AI",只有"最对口的 AI"。

回到你这个开茶餐厅、做贸易、做小服务公司的 SME 老板。你不用学 Claude Code,不用懂什么 transformer 架构。但你要知道一件事——根据任务派工具,不要根据习惯派工具

给你三个分类,照着用就行:

第一类:对外的、要哄人的、要安全的内容。 比如客户邮件、营销文案、社交媒体帖子、公司介绍。用 ChatGPT 就够了。它就是被训练来取悦人的,干这个活它最顺手。你让 Claude 写营销文案,它会写得像学术论文,没人想看。

第二类:要动脑、要严谨、要不被骗的内容。 比如合同条款分析、商业计划书、财务模型逻辑、代码、报告。用 Claude。它会跟你顶嘴,会说"你这个假设站不住脚",这正是你需要的。一个会哄你的工具,在做决策的时候是有毒的。

第三类:要新鲜、要市场感、要知道"现在大家在想什么"的内容。 比如某个行业的最新动态、某个产品的口碑、某个地区的消费情绪。用 Grok 或者 Perplexity。ChatGPT 的训练数据可能是去年的,你拿去年的情绪做今年的决定,是要亏钱的。

一个具体的下一步: 这周,挑一个你过去一个月用 ChatGPT 做过的任务——任何一个——把同样的 prompt 复制粘贴到 Claude 里跑一遍,再到 Grok 里跑一遍。三个答案摆在你面前对比。你会立刻明白我今天在说什么,比读十篇文章都管用。Claude 和 Grok 都有免费版,花不了你一分钱,花你二十分钟。

最后再说一遍那颗星:模型是它训练数据的儿子。搞清楚它喝的是什么水,你就知道它能给你端出什么菜。

—— 老张