Thông báo từ ChainCatcher, công ty hạ tầng AI Phi tập trung Gata công bố ra mắt tập dữ liệu hội thoại ChatGPT thực của người dùng toàn cầu ChatGPT-RealUser-2.2M. Tập dữ liệu này được thu thập thông qua chương trình GPT-to-Earn của Gata (người dùng tham gia tự nguyện), đã tổng hợp hơn 2,24 triệu cuộc hội thoại thực và gần 3,56 triệu cặp hỏi-đáp từ hơn 15.000 người dùng thực, bao gồm các tương tác với GPT-3.5, GPT-4 và o1. Theo giới thiệu, tập dữ liệu này có quy mô gấp đôi các tập dữ liệu tương tự trước đây của Viện AI Allen, bao phủ các tình huống thực tế, cuộc đối thoại đa vòng, và do cơ chế khuyến khích trên chuỗi, bao gồm nhiều tương tác liên quan đến tiền điện tử. Phiên bản xem trước đã được ra mắt trên Hugging Face, bao gồm 600 mẫu cuộc đối thoại, tập dữ liệu đầy đủ có thể được sử dụng cho nghiên cứu và ứng dụng thương mại. Theo thông tin, vào tháng 5 năm 2025, Gata đã công bố hoàn thành vòng gọi vốn hạt giống tổng trị giá 4 triệu đô la, trong đó có sự tham gia của YZi Labs, IDG Blockchain.