2025年12月22日 – Tether DataのAI研究部門であるQVACは、本日、世界最大の公開利用可能な合成教育データセットの大規模拡張版であるQVAC Genesis IIを発表しました。新たに1070億のトークンを追加し、QVAC Genesisデータセットは合計1480億トークンとなり、19の教育分野にわたるデータをカバーしています。これにより、オープンAIトレーニングデータの規模、深さ、推論の質が大幅に向上しました。QVAC Genesis IIは、STEMの主要分野を網羅した厳格に検証された教育重視の合成データセットを提供したQVAC Genesis Iの基盤の上に直接構築されています。この第2弾リリースでは、化学、コンピュータサイエンス、統計学、機械学習、天文学、地理学、計量経済学、電気工学などの新たな10の分野をカバーし、改良された手法を用いて大学レベルの物理学も再生成しています。Genesis IとIIを合わせて、これまでで最も包括的な合成教育データセットとなっています。
このリリースの中心となるのは、「オプションレベル推論(Option-Level Reasoning)」と呼ばれる新しいデータ生成手法です。これは、モデルの失敗からだけでなく、正解からも構造化された推論を抽出することを目的としています。正解を完成品として扱うのではなく、多肢選択問題のすべての選択肢を体系的に分析し、正しい推論を強化しながら一般的な誤解にも明示的に対処します。その結果、表面的な正確さだけでなく、明確さ、因果関係、意思決定を重視したトレーニングデータが作成されます。
この新しいアプローチは、Genesis Iで導入された「失敗分析(Failure Analysis)」と補完し合い、すべての生成された質問が教育的価値を持つことを保証する二重の手法パイプラインを形成しています。独立した評価では、Genesis IIのデータで訓練されたモデルは、推論の正確さが格段に向上し、以前の合成データセットで訓練されたモデルよりもはるかに明確で曖昧さのない回答を一貫して生成できることが示されています。
このリリースは単なる規模の拡大にとどまらず、教育用AIデータの構築方法に意図的な変化をもたらすものです。多くの業界がテキストのスクレイピングと集約に注力する中、QVACのアプローチは、モデルに「考える」「推論する」「説明する」方法を教えることに焦点を当てており、知性を模倣ではなく理解に基づかせることを目指しています。
「今日のAIトレーニングの多くは流暢さを最適化しているだけで、理解を重視していません」と、TetherのCEOであるPaolo Ardoinoは述べています。「このリリースにより、私たちは規模を超え、構造、推論、明確さへと進化させています。知性は、何かが正しい理由を理解することに基づいて構築されるべきであり、ただ正しそうに聞こえることを予測するだけではありません。このデータセットを公開することで、研究者や開発者に、より信頼性が高く、説明可能で、最終的には社会にとって有用なAIを開発するためのツールを提供しています。」
Genesis Iと同様に、拡張されたデータセットは、研究者、学術機関、独立した開発者がクローズドな独自システムの外で作業できるよう、オープンに公開されています。これは、Creative Commons Attribution–NonCommercial (CC-BY-NC 4.0)ライセンスの下で提供されており、QVACのオープンでコミュニティ主導のAI研究へのコミットメントを強化しています。
このリリースは、AIモデルを中央集権的なクラウドプラットフォームに依存せずに訓練、改良、展開できる、ローカルで分散型の知性を推進するQVACのより広範な使命を継続しています。AIトレーニングデータのオープンな基盤を強化することで、Tether Dataはイノベーションの障壁を低減し、高品質な知性が世界中の研究コミュニティにアクセス可能であり続けることを目指しています。
「QVAC Genesis II:最大かつ最高品質のマルチドメイン教育合成データセットの拡張」の詳細な技術解説は、現在、QVACリサーチブログおよびHugging Faceのデータセットとモデルへのアクセスとともに公開されています。さらに詳しい情報やFAQは、QVACのウェブサイトでご覧いただけます。
この記事は元々、「Tether Releases QVAC Genesis II」としてCrypto Breaking Newsに掲載されました。あなたの信頼できる暗号通貨ニュース、ビットコインニュース、ブロックチェーンアップデートの情報源です。
9.68K 人気度
21.17K 人気度
14.92K 人気度
7.12K 人気度
97.6K 人気度
テザー、QVAC Genesis IIをリリース
2025年12月22日 – Tether DataのAI研究部門であるQVACは、本日、世界最大の公開利用可能な合成教育データセットの大規模拡張版であるQVAC Genesis IIを発表しました。新たに1070億のトークンを追加し、QVAC Genesisデータセットは合計1480億トークンとなり、19の教育分野にわたるデータをカバーしています。これにより、オープンAIトレーニングデータの規模、深さ、推論の質が大幅に向上しました。QVAC Genesis IIは、STEMの主要分野を網羅した厳格に検証された教育重視の合成データセットを提供したQVAC Genesis Iの基盤の上に直接構築されています。この第2弾リリースでは、化学、コンピュータサイエンス、統計学、機械学習、天文学、地理学、計量経済学、電気工学などの新たな10の分野をカバーし、改良された手法を用いて大学レベルの物理学も再生成しています。Genesis IとIIを合わせて、これまでで最も包括的な合成教育データセットとなっています。
このリリースの中心となるのは、「オプションレベル推論(Option-Level Reasoning)」と呼ばれる新しいデータ生成手法です。これは、モデルの失敗からだけでなく、正解からも構造化された推論を抽出することを目的としています。正解を完成品として扱うのではなく、多肢選択問題のすべての選択肢を体系的に分析し、正しい推論を強化しながら一般的な誤解にも明示的に対処します。その結果、表面的な正確さだけでなく、明確さ、因果関係、意思決定を重視したトレーニングデータが作成されます。
この新しいアプローチは、Genesis Iで導入された「失敗分析(Failure Analysis)」と補完し合い、すべての生成された質問が教育的価値を持つことを保証する二重の手法パイプラインを形成しています。独立した評価では、Genesis IIのデータで訓練されたモデルは、推論の正確さが格段に向上し、以前の合成データセットで訓練されたモデルよりもはるかに明確で曖昧さのない回答を一貫して生成できることが示されています。
このリリースは単なる規模の拡大にとどまらず、教育用AIデータの構築方法に意図的な変化をもたらすものです。多くの業界がテキストのスクレイピングと集約に注力する中、QVACのアプローチは、モデルに「考える」「推論する」「説明する」方法を教えることに焦点を当てており、知性を模倣ではなく理解に基づかせることを目指しています。
「今日のAIトレーニングの多くは流暢さを最適化しているだけで、理解を重視していません」と、TetherのCEOであるPaolo Ardoinoは述べています。「このリリースにより、私たちは規模を超え、構造、推論、明確さへと進化させています。知性は、何かが正しい理由を理解することに基づいて構築されるべきであり、ただ正しそうに聞こえることを予測するだけではありません。このデータセットを公開することで、研究者や開発者に、より信頼性が高く、説明可能で、最終的には社会にとって有用なAIを開発するためのツールを提供しています。」
Genesis Iと同様に、拡張されたデータセットは、研究者、学術機関、独立した開発者がクローズドな独自システムの外で作業できるよう、オープンに公開されています。これは、Creative Commons Attribution–NonCommercial (CC-BY-NC 4.0)ライセンスの下で提供されており、QVACのオープンでコミュニティ主導のAI研究へのコミットメントを強化しています。
このリリースは、AIモデルを中央集権的なクラウドプラットフォームに依存せずに訓練、改良、展開できる、ローカルで分散型の知性を推進するQVACのより広範な使命を継続しています。AIトレーニングデータのオープンな基盤を強化することで、Tether Dataはイノベーションの障壁を低減し、高品質な知性が世界中の研究コミュニティにアクセス可能であり続けることを目指しています。
「QVAC Genesis II:最大かつ最高品質のマルチドメイン教育合成データセットの拡張」の詳細な技術解説は、現在、QVACリサーチブログおよびHugging Faceのデータセットとモデルへのアクセスとともに公開されています。さらに詳しい情報やFAQは、QVACのウェブサイトでご覧いただけます。
この記事は元々、「Tether Releases QVAC Genesis II」としてCrypto Breaking Newsに掲載されました。あなたの信頼できる暗号通貨ニュース、ビットコインニュース、ブロックチェーンアップデートの情報源です。