Провайдеры и маршрутизация

Управление маршрутизацией AI-провайдеров, цепочками резерва и региональной доступностью

14/15 Работает

Подключённые провайдеры

O

OpenAI

US East

120мс

Задержка

99.95%

Аптайм

18

Модели

A

Anthropic

US East

95мс

Задержка

99.98%

Аптайм

12

Модели

G

Google AI

US Central

110мс

Задержка

99.92%

Аптайм

15

Модели

M

Meta AI

US West

85мс

Задержка

99.9%

Аптайм

10

Модели

Mi

Mistral AI

EU West

75мс

Задержка

99.88%

Аптайм

8

Модели

C

Cohere

US East

130мс

Задержка

99.85%

Аптайм

6

Модели

D

DeepSeek

Asia

150мс

Задержка

99.8%

Аптайм

5

Модели

P

Perplexity

US West

200мс

Задержка

99.7%

Аптайм

4

Модели

T

Together AI

US West

90мс

Задержка

99.92%

Аптайм

20

Модели

F

Fireworks AI

US West

65мс

Задержка

99.94%

Аптайм

15

Модели

Gr

Groq

US Central

35мс

Задержка

99.96%

Аптайм

8

Модели

AW

AWS Bedrock

Multi-region

140мс

Задержка

99.99%

Аптайм

12

Модели

Az

Azure OpenAI

Multi-region

125мс

Задержка

99.97%

Аптайм

10

Модели

R

Replicate

US West

180мс

Задержка

99.75%

Аптайм

25

Модели

L

Lepton AI

US West

100мс

Задержка

99.82%

Аптайм

6

Модели

Правила маршрутизации

Правила по приоритету, определяющие выбор провайдера

1

Наименьшая задержка

Активно

Направлять запросы провайдеру с наименьшей текущей задержкой

2

Приоритет US-регионов

Активно

Приоритизировать провайдеров в регионах US East и US West

3

Оптимизация стоимости

Отключено

Предпочитать провайдеров с наименьшей стоимостью за токен при допустимой задержке

4

Высокая доступность

Активно

Пропускать провайдеров с аптаймом ниже 99.9% за последние 30 дней

Цепочки резерва

Автоматическое переключение при недоступности провайдера

Цепочка GPT-4

Основной
OpenAI
Резервный
Azure OpenAI
Третичный
Together AI

Цепочка Claude

Основной
Anthropic
Резервный
AWS Bedrock
Третичный
Google AI

Быстрый инференс

Основной
Groq
Резервный
Fireworks AI
Третичный
Together AI
Третичный
Mistral AI
Региональная доступность

Распределение провайдеров по глобальным регионам

US East

3
OpenAI
Anthropic
Cohere

US West

6
Meta AI
Together AI
Fireworks AI
Perplexity
Replicate
Lepton AI

US Central

2
Google AI
Groq

EU West

1
Mistral AI

Asia

1
DeepSeek

Multi-region

2
AWS Bedrock
Azure OpenAI
Сравнение задержки

Среднее время ответа по всем провайдерам (мс)

Предпочтительный провайдер

Выберите провайдера по умолчанию для всех запросов

A

Anthropic

работает

Задержка

95мс

Аптайм

99.98%

Регион

US East

Модели

12