ベンチマーク– tag –
-
Product Research
FrontierScience by OpenAI – AI科学推論能力を評価する専門家レベルベンチマーク
FrontierScienceは、AIモデルの専門家レベル科学推論能力を物理・化学・生物学で評価する革新的ベンチマーク。オリンピアード問題と実研究タスクの両方を測定し、科学研究の質とスピードを飛躍的に向上させるツールです。 -
Product Research
LLM Stats – AIモデルのベンチマーク・コスト比較に特化した統合分析ツール
数百のAIモデルの性能・コスト・機能を統合的に分析・比較できるLLM Stats。詳細なベンチマークデータとAPIプレイグラウンドを通じて、プロジェクトに最適なAIモデルの選定を支援します。
1