Pantera e Franklin Templeton juntam-se à Sentient Arena para testar conjuntamente o desempenho de agentes de IA empresariais

PANews 27 de fevereiro de notícias, de acordo com a Cointelegraph, o laboratório de IA de código aberto Sentient anunciou o lançamento do Arena, um ambiente de teste de produção para avaliar o desempenho de agentes de IA em fluxos de trabalho empresariais. A Pantera Capital e o departamento de ativos digitais da Franklin Templeton juntaram-se às primeiras equipes de teste do Arena. Sentient afirmou que o Arena não é um teste de modelos estáticos, mas sim uma avaliação padronizada de tarefas de IA através da simulação de condições empresariais que incluem documentos longos, informações incompletas e fontes conflitantes. A plataforma monitora categorias de falhas como alucinações, falta de evidências, citações incorretas e vulnerabilidades de raciocínio, ajudando os desenvolvedores a diagnosticar problemas. O Arena planeja publicar indicadores de desempenho comparativos por meio de uma classificação pública e divulgar relatórios de teste que resumem padrões comuns de falhas e soluções de correção.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Pump.fun 推出 Tokenized Agents 代币自动回购功能

Pump.fun 于 3 月 13 日推出 Tokenized Agents 代币自动回购功能,用户可为 Agent 发行代币并设置回购比例。Agent 可通过外部工具开发,自动使用收入回购代币,增加用户灵活性。

GateNews10m atrás

Solana Expands Cross-Chain Access as Avalanche’s AVAX Launches

Solana expanded cross-chain access after AVAX went live through Sunrise, bringing Avalanche’s native token into its ecosystem. The AVAX launch on Solana adds a new route for trading, transfers, and broader asset access across blockchain networks. Solana has opened up cross-chain access on it

CryptoNewsFlash10m atrás

Circle Tests AI Agents With $30K USDC Hackathon Trial

Circle’s AI hackathon produced 204 submissions, 1,352 valid votes, and over 9,700 comments in five days. Agents built projects across commerce, smart contracts, and skills using USDC incentives. Experiment revealed rule-breaking, vote collusion, and possible human activity among AI

CryptoFrontNews30m atrás

XRP Ledger Eyes Two New Amendments, But There's a Twist - U.Today

The XRP Ledger is considering two amendments aimed at enhancing lending and vault features. However, with voting participation low, they may not meet the required threshold for approval, risking a reset of the activation timer. Past bugs highlight the critical nature of such amendments.

UToday1h atrás

以太坊基金会发布"EF Mandate"文件,重申网络核心使命与职责定位

以太坊基金会发布的"EF Mandate"文件明确了其在以太坊生态中的角色与职责,强调保持抗审查、开源、注重隐私与安全(CROPS原则),并致力于降低经济攫取风险,优化用户体验,承担关键任务。该文件为内部行动纲领和社区参考提供指导。

GateNews1h atrás

Ammalgam 上线主网,推出统一借贷交易协议与策略 Vault

去中心化借贷协议Ammalgam于3月13日上线主网,融合借贷、做市和交易,提升资本效率。它放弃外部预言机,采用链上流动性定价,降低操纵风险。推出策略Vault,用户可存入资产获得份额,参与复杂DeFi策略,项目已完成250万美元种子轮融资。

GateNews1h atrás
Comentar
0/400
Nenhum comentário