架构帮助降低90%的成本,同时保持原有质量

robot
摘要生成中

德尔菲数字的研究对市场具有巨大影响。然而,当他们开发一款用于深度加密分析的AI产品时,项目差点因为经济问题过于严苛而“夭折”。
关于链上数据、代币经济学或估值模型的复杂查询,每个可能耗费几美元。如果扩大规模到数千用户,成本将远远超出可持续运营的能力。
他们没有选择简单地切换到更便宜的模型,而是重新设计了整个系统架构。

三层架构解决成本难题 1️⃣ 智能查询路由器(Intelligent Query Router)
超过60%的查询无需调用大型语言模型(LLM)。
价格数据 → 直接调用API
基础定义、概念 → 从缓存中获取
只有真正复杂的分析 → 才激活推理模型
原则:用对工具做对事。
并非所有问题都需要“重型”AI。

2️⃣ 多层缓存(Tiered Caching)
大部分问题会重复出现。
内容变化不大 → 预先生成(pre-generate)
内容缓慢变化 → 缓存
实时动态内容 → 实时生成
效果:
响应延迟减少70%
系统更稳定
推理成本大幅降低

3️⃣ 盲测模型(Blind Model Testing)
德尔菲将相同的查询同时发给多个不同模型。
专家在不知道来源的情况下评估结果。
令人惊讶的结论:
小模型的表现通常与大模型相当。
因此,他们将查询路由到成本最低但仍满足质量要求的模型。

核心因素:验证准确性
只有确保可靠性,优化成本才真正有效。
这时,@mira_network的作用凸显。
去中心化的共识机制帮助验证输出结果,使德尔菲可以信赖使用更便宜的模型,而无需扩大人工审核团队。

成果
成本降低90%
保持分析质量
加快响应速度
系统运行更可持续

最大教训
技术能力如果不配合经济部署能力,只停留在研究阶段。
德尔菲证明:
部署问题(deployment problem)与模型问题(model problem)同样重要。
而有像#Mira这样的验证层在背后,两个问题都能得到解决。
$MIRA
{spot}(MIRAUSDT)

MIRA-6.49%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)