上周我将Mira添加到一个已经在运行的流程中。



没什么特别的。它从合同中提取条款,并将其发送到下游的分类器。模型的准确率还可以。延迟也还行。没有人抱怨性能问题。

问题不在模型。

问题在于签字确认。

每一个提取的条款仍然必须由人工审核后才能继续。不是因为模型不好,而是因为合规部门不关心置信度分数。他们关心的是证据。政策明确写着“人工验证”。这条线不会因为基准提升而改变。

所以我没有再争论模型的准确性,而是尝试了不同的方法。

我安装了Mira SDK。
指向端点,添加了密钥,运行了第一次调用。

响应看起来很正常。如果只看输出,你不会觉得有什么变化。

不同之处在日志中显示。

第一条:简单内容。日期引用。适用法律。标准条款。验证器几乎立即识别出来。形成法定人数很快。权益已提交。证书已发放。输出哈希已锚定。

完成。

第二条乍一看也类似。相同的合同集。但这次有一个赔偿豁免条款,带有条件性措辞。那种根据阅读方式或管辖区不同而改变含义的语言。

这次没有那么快通过。

你实际上可以看到验证器形成意见。不同模型。不同训练轮次。每个都独立评估相同的声明。

有的偏向一方,有的偏向另一方。

法定人数的权重上升。
暂停。
再次上升。

最终超过了阈值。证书打印出来。验证通过。

但还有一个不同之处:异议权重。

虽然声明通过了,但异议比第一条更高。那个数字一直可见。

在旧的流程中,这些都不存在。模型会以自信的语气返回答案。一切看起来都同样确定。你永远不会知道有多种合理的解释。

这里,声明仍然通过。但你可以看到实际的共识有多清晰。

我测试了更多条款。

每次都遵循相同的模式。

明确的事实声明处理得很快。共识很快形成。异议低。很容易。

解释性声明则需要更长时间。信心在波动后才稳定。有时即使证书已发放,异议仍然很高。

这些变得更有趣。

没人要求那样的信号。最初的目标很简单:用某种加密方式取代“人工验证”。

但一旦日志中出现了异议权重,工作流程就自动改变了。

审核员开始优先处理异议较高的条款。不是因为验证失败,而是系统显示了真正存在不确定性的地方。

共识较高的条款不再自动进行二次审核。

审核队列变少了。

不是因为模型变得更聪明,而是不确定性不再被隐藏。

旧流程会把一切都平铺直叙。每个输出都看起来同样有信心。所以人们会认为每个都可能有风险。

现在有了一个梯度。

有些条款明显可靠,有些明显不可靠,还有一些处于灰色地带。

那种灰色地带以前是看不见的。

Mira不会假装不同意不存在。它会记录它。证书不仅仅写“是”。它显示网络达成一致的强度。

事实证明,这正是合规部门真正需要的。

不是多增加一个百分比的准确率。

也不是更花哨的模型。

只是一种能看到模型可能出错的方式。

一旦你能看到这一点,你就不会再用同样的方式审核所有内容了。

#MIRA $MIRA
MIRA3.02%
查看原文
post-image
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 1
  • 转发
  • 分享
评论
0/400
ybaservip
· 1小时前
钻石手 💎
查看原文回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)