Groq15 дек. 2024 г.

Llama 3.3 70B (Groq)

Llama 3.3 served on Groq hardware for ultra-low latency inference.

ToolsJSONFast

Основные метрики

Цена входа

$0.59/ 1M токенов

Цена выхода

$0.79/ 1M токенов

Контекст

128Kтокенов

Медианная задержка

25мс

Надёжность

99.9%аптайм

Запросов/день

290Kср. объём

Возможности

Function Calling

JSON Mode

Streaming

Text

Доступные провайдеры

Провайдер	Статус	Регион	Цена	Задержка	Состояние
Groq	operational	US Central	$0.59 / 1M	25мс	Работает

Пример API

curl -X POST https://api.tor.ai/v1/chat/completions \
  -H "Authorization: Bearer $TOR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "groq/llama-3.3-70b-versatile",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Hello, how are you?"}
    ],
    "temperature": 0.7,
    "max_tokens": 1024
  }'

Llama 3.3 70B (Groq)

Основные метрики

Возможности

Доступные провайдеры

Пример API

Похожие модели