Ollama ベンチマーク:効率的な LLM 比較ツール
Ollama Benchmarkは、Mistral、LLaMA、Qwenなどのさまざまな大規模言語モデル(LLM)をベンチマークし、比較するために設計された無料のChrome拡張機能です。このツールは、ユーザーが複数のモデルで同時にプロンプトベースのテストを実施できるようにし、トークン数、応答時間、処理速度などのパフォーマンスメトリクスに関する洞察を提供します。ユーザーフレンドリーなインターフェースは英語とトルコ語の両方をサポートしており、より広いオーディエンスにアクセス可能です。
主な機能には、比較のために複数のモデルを選択する機能、.txt、.csv、または.jsonなどの複数の形式で結果をエクスポートする機能、設定と結果をローカルに保存する機能が含まれています。この拡張機能は、ローカルおよびリモートのOllama APIの両方で動作できるため、使用の柔軟性を確保しています。特に、ユーザーデータを収集せずにブラウザ内ですべてのデータを処理することで、ユーザーのプライバシーを強調しています。