GEO创业 - 戚兆禹

这个现在其实miaozhen已经做的挺好的了。

这是一个非常前沿且有价值的想法！随着搜索引擎逐渐向生成式引擎（Generative Engines，如 ChatGPT, Perplexity, Google Gemini 等）转变，品牌在这些 AI 中的“可见性”和“推荐排名”变得至关重要。这就是 GEO (Generative Engine Optimization) 的核心。

创建一个针对不同行业的 LLM 品牌排名评测小程序，不仅能抓住当下的热点，还能为企业提供极具价值的营销洞察。

为了给你提供最准确的市场现状和竞品分析，我将使用网络搜索工具来查找目前 GEO 评测的主流方法和现有的类似产品。

步骤 1：确认需求与启动搜索 我将搜索以下内容：

GEO (Generative Engine Optimization) methodologies: 目前业界是如何定义和衡量 GEO 的。
LLM Brand Ranking / Benchmarks: 是否有现成的针对品牌的 LLM 排名工具。
GEO SaaS / Tools: 是否有现成的竞品（SaaS 或小程序）。
Share of Model (SoM): 这是一个关键指标，我要看看大家是怎么计算的。

请稍等，我马上为你进行搜索。

这绝对是一个非常敏锐且极具潜力的切入点。目前的市场正处于**“从 SEO（搜索引擎优化）向 GEO（生成式引擎优化）”**转型的早期爆发阶段。

虽然市面上已经涌现出一些 B2B 的 SaaS 工具，但针对大众或行业垂直领域的公开“榜单型”小程序还是一片蓝海。

基于我搜索到的信息和对行业的分析，我为你梳理了一份详细的 GEO 评测与小程序落地实施方案。

一、市场现状与竞品分析 (知己知彼)

目前的竞品主要集中在欧美市场的 B2B SaaS 领域，它们更多是卖给企业内部市场部用的“监控工具”，而不是公开的“排行榜”。

国外主流竞品（主要是工具，非榜单）：
- Semrush Enterprise AIO / AI Visibility Toolkit: 传统 SEO 巨头的转型产品，功能非常强大。
- Jellyfish Share of Model™: 提出“Share of Model (SoM)”概念，衡量品牌在模型中的份额。
- Search Atlas / Rank Prompt / AIclicks: 专注于监测品牌在 ChatGPT、Perplexity 等平台的可见性。
国内现状:
- 目前国内有个别的营销号或咨询公司会发“年度 AI 品牌榜”，但大多是静态报告，缺乏实时更新的工具。
- 机会点： 还没有一个类似“百度指数”或“微博热搜”的 “LLM 品牌热度榜”小程序。

二、你的 GEO 评测核心方案 (核心算法)

要做榜单，核心是**“评分标准” (The Metric)**。既然是小程序，算法逻辑要简单直观，但背后数据要硬核。

建议采用 “GEO 综合指数” 模型，包含以下四个维度：

基础维度设计

测试对象 (The LLMs): 必须包含国内外主流模型。
- 国外: ChatGPT-4o, Claude 3.5, Google Gemini, Perplexity (非常重要，因为它联网)。
- 国内: 百度文心一言 (Ernie), 阿里通义千问, 腾讯混元, Kimi (月之暗面)。
测试行业 (The Vertical): 美妆、汽车、手机、饮料、奢侈品等。

核心指标体系 (你的“护城河”)

你需要定义一个分数，比如 “AI 推荐指数 (AI Recommendation Index, ARI)”，满分 100 分。

A. 可见性 (Visibility - 30%):
- Prompt: “推荐几款适合油皮的粉底液。”
- 计分: 品牌是否出现在回答中？(出现在前 3 名得高分，出现在列表得低分，未出现 0 分)。
B. 份额 (Share of Model, SoM - 30%):
- 测试: 连续问 50 次相关问题，或者换 50 种不同的问法（长尾词）。
- 计分: 你的品牌在所有提及的品牌中占比多少？
C. 情感/口碑 (Sentiment - 20%):
- Prompt: “评价一下 [品牌名] 的产品怎么样？”
- 计分: 使用 NLP 分析 AI 回答的情感倾向（正面、中立、负面）。AI 是否提到了品牌的负面新闻？
D. 引用权威性 (Citation - 20%):
- 场景: 针对联网模型 (Perplexity/New Bing/Kimi)。
- 计分: AI 提到该品牌时，引用的链接是官网、权威媒体，还是野鸡论坛？（引用源越权威，分数越高）。

三、小程序产品落地建议 (MVP 版本)

不要一开始就做一个大而全的 SaaS，从小程序切入非常聪明，利用微信的社交裂变。

产品功能架构

首页 - 行业红黑榜:
- “本周美妆品牌 AI 推荐榜 Top 10”
- “本周跌幅最大的品牌” (制造焦虑，吸引点击)
PK 竞技场 (裂变核心):
- 用户输入两个品牌（例如：雅诗兰黛 vs 兰蔻）。
- 系统实时跑一遍 3-4 个主流 LLM。
- 生成一张对比图：“在 ChatGPT 眼里，兰蔻更胜一筹，因为……”
- 按钮: “生成海报分享到朋友圈”。
品牌体检 (B2B 钩子):
- 输入品牌名，生成简报：“你的品牌在 Kimi 上存在 3 个严重的认知错误，点击咨询修复方案”。

技术实现路径 (低成本启动)

后端: Python (FastAPI/Flask)。
LLM 交互: 使用 LangChain 或直接调用各家 API。
成本控制: 早期不要实时跑所有数据。
- 榜单数据: 每周跑一次脚本，存入数据库。
- PK 数据: 实时调用，但限制免费次数。

四、商业化路径 (怎么赚钱)

付费解锁详情 (To C/小 B): 榜单看排名免费，想看“为什么 AI 没推荐我”的具体 Prompt 和回答分析，支付 9.9 元或订阅会员。
品牌 GEO 优化服务 (To B - 大头):
- 小程序是获客入口。当品牌发现自己在榜单排名低，或者 AI 在“胡说八道”时，他们会非常恐慌。
- 服务: “我们将帮助修正 Wikipedia、优化官网结构、发布高质量评测文章，从而提升您在 LLM 中的排名。”
行业深度报告: 出售《2025 美妆行业 GEO 趋势白皮书》。

五、给你的特别建议

抓住“联网搜索”的变量: 现在的 LLM 越来越依赖 RAG (检索增强)。你的评测一定要区分 “纯模型知识” (训练数据) 和 “联网搜索结果” (Perplexity/Kimi)。后者更容易被人工干预优化，也是你卖服务的切入点。
起个好名字: 比如“AI 也就是这么看”、“品牌 AI 指数”、“GEO 听诊器”。
先做“美妆”或“3C”: 这两个行业用户最喜欢在买东西前搜攻略，也是 AI 推荐影响权重最大的领域。

这个项目技术门槛适中，但运营价值和 B 端变现潜力巨大。如果你能率先定义出“中国市场的 GEO 标准”，你就赢了一半。

这个洞察非常关键！你直接点到了 GEO 评测的命门。

做 GEO 评测和做普通应用开发完全不同。普通开发是为了“用模型解决问题”，而你是为了“评测模型本身的行为”。

如果用第三方的“联网插件”（比如 LangChain 挂一个 Google Search），你测出来的是 “LLM + 外部搜索插件” 的能力，而不是 “Kimi / New Bing / Perplexity 原生” 的推荐结果。这会导致评测数据失真，因为 GEO 的核心就是看各家模型自带的“搜索-总结-推荐”逻辑偏好。

既然确定了必须用官方原生联网能力，情况就变得复杂了一些，因为各家 API 对“联网（Web Search / Grounding）”的支持方式完全不同。

目前主流模型 API 对“联网能力”的支持现状如下，我为你整理了一份避坑指南：

🟢 原生支持联网 (API 直接能开) —— 最方便

这部分是你评测的“主力军”，API 参数里有个开关，打开就能搜。

Perplexity (pplx-api)
- API 能力: 它的 sonar-online 系列模型是专门为联网设计的。
- GEO 价值: ⭐⭐⭐⭐⭐ (GEO 必测对象)。它是目前最标准的“答案引擎”。
- 调用方式: 官方 API，模型选 llama-3-sonar-large-32k-online 等。它会返回引用的 citations（角标），这对你分析“引用源权威性”至关重要。
Google Gemini (Vertex AI / AI Studio)
- API 能力: 支持 Google Search Grounding。
- GEO 价值: ⭐⭐⭐⭐⭐。Google 的亲儿子，未来的流量入口。
- 坑点: 需要在 API 请求里显式配置 tools: [{google_search_retrieval: {}}]。返回的数据里会包含 groundingMetadata，告诉你它参考了哪些网页。
智谱 AI (ChatGLM)
- API 能力: 官方 API 自带联网工具（Web Search）。
- GEO 价值: ⭐⭐⭐⭐。国内第一梯队。
- 调用方式: tools 参数里声明 web_search。
Kimi (Moonshot AI) / 零一万物
- API 能力: 需要特别注意。早期的 API 版本是纯文本模型。现在部分接口支持联网，或者你需要使用它们的企业级平台（如火山引擎接入 Moonshot）才可能有联网开关。
- 现状: Kimi 的官方 API 目前主要还是长文本模型（File 强），原生联网搜索 API 开放程度不一，有时需要申请白名单。（注：如果官方 API 暂未完全开放联网开关，可能需要通过逆向或等待更新，这点要随时查阅官方文档）

🟡 伪联网 / 需要配合插件 (RAG) —— 评测难点

很多大模型（如 OpenAI 的 GPT-4o API）本身是不联网的。你在 ChatGPT 网页版看到它能上网，是因为网页版挂载了 Bing 浏览器工具。

OpenAI (GPT-4o / GPT-4-turbo):
- 现状: 官方 API (chat/completions) 默认不联网。
- 如果你想测 ChatGPT 的 GEO: 你面临一个悖论。
  - 方案 A (测纯模型): 你测不到即时资讯，测不到品牌最新排名。
  - 方案 B (官方 Assistant API): OpenAI 的 Assistants API 支持 file_search，但目前对开放互联网的实时搜索支持（类似 Browsing）在 API 层面非常受限或昂贵，通常需要结合 Bing Search API 自己做 RAG。
- GEO 评测结论: 对于 OpenAI，你可能无法通过 API 复现网页版的“搜索推荐”体验。建议： 这部分可能需要单独标注，或者使用 Bing Search API + GPT-4o 的组合来模拟“微软系”的生态（毕竟 New Bing 才是 GEO 的重点，而不是纯 ChatGPT）。

🔴 封闭生态 (小程序/私有协议) —— 最难测

国内有些“超级应用”里的 AI 搜索（比如微信里的“微信听一听”AI 搜、小红书的 AI 搜、抖音的豆包），它们没有开放对应的带有搜索能力的 API。

抖音 (豆包): 虽然火山引擎有 API，但那是给开发者用的模型。抖音 App 里那个“豆包”的推荐逻辑（结合了抖音内部视频流数据），你是调不到的。
小红书 (达芬奇): 暂无公开 API。

为你的小程序后端架构提出的新方案

🛠 实操技术栈推荐 (Python)

如果你决定走 “API 为主 + 网页 RPA 为辅” 的路线，针对豆包/Kimi 的网页版，推荐使用以下工具：

自动化工具：DrissionPage (强烈推荐)

这是一个国产的 Python 库，专门治各种反爬。

对比: 比 Selenium 轻量，比 Requests 强。
优势: 它可以接管浏览器，不需要 webdriver，这让它很难被网站检测出是“机器人”。
场景: 用它打开 doubao.com，自动登录（保存 Cookies），输入问题，获取答案。

浏览器指纹伪装：Stealth.js

无论用什么框架，必须伪装浏览器指纹（User-Agent, Canvas 指纹等），让豆包觉得你是用 Chrome 浏览器的真人，而不是 Python 脚本。

验证码解决：云码平台

如果遇到滑块验证码，不要自己写算法破解，直接接入“打码平台”的 API，几分钱解一次，花钱买效率。

一、 市场现状与竞品分析 (知己知彼)

二、 你的 GEO 评测核心方案 (核心算法)