Все модели
Groq15 дек. 2024 г.

Llama 3.3 70B (Groq)

Llama 3.3 served on Groq hardware for ultra-low latency inference.

ToolsJSONFast

Основные метрики

Цена входа
$0.59/ 1M токенов
Цена выхода
$0.79/ 1M токенов
Контекст
128Kтокенов
Медианная задержка
25мс
Надёжность
99.9%аптайм
Запросов/день
290Kср. объём

Возможности

Function Calling
JSON Mode
Streaming
Text

Доступные провайдеры

ПровайдерСтатусРегионЦенаЗадержкаСостояние
Groq
operational
US Central$0.59 / 1M25мсРаботает

Пример API

curl -X POST https://api.tor.ai/v1/chat/completions \
  -H "Authorization: Bearer $TOR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "groq/llama-3.3-70b-versatile",
    "messages": [
      {"role": "system", "content": "You are a helpful assistant."},
      {"role": "user", "content": "Hello, how are you?"}
    ],
    "temperature": 0.7,
    "max_tokens": 1024
  }'

Похожие модели