DeepSeek API: $0.28 за миллион токенов и почему это меняет экономику проектов

В январе 2025 года DeepSeek опубликовал модель с ценами, которые переписали рынок. $0.28 за миллион входящих токенов и $1.10 за выходящих — в разы дешевле OpenAI при сопоставимом качестве.

Актуальные модели

deepseek-chat (V3.2) — режим без размышлений. Подходит для классификации, суммаризации, пайплайнов с инструментами. Максимум 8 тысяч токенов на выходе. Контекст — 128 тысяч токенов.

deepseek-reasoner — режим с видимой цепочкой рассуждений CoT. До 64 тысяч токенов на выходе. Лучше для математики, логики, сложного кода.

Ценообразование V3.2

Cache hit (повторяющийся префикс): $0.028 за миллион токенов. Cache miss: $0.28 за миллион. Output: $0.42 за миллион.

Кэш включён по умолчанию. Если запросы начинаются с одного системного промпта — кэш срабатывает автоматически, стоимость падает в 10 раз.

Как подключиться

API совместим с форматом OpenAI. В большинстве проектов достаточно изменить base_url и api_key:

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_DEEPSEEK_KEY",
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[{"role": "user", "content": "Привет"}]
)
print(response.choices[0].message.content)

Ключ — на platform.deepseek.com. Российские карты принимает через посредников.

Ограничения

Серверы в Китае — важно для проектов с требованиями к локализации данных. При интенсивной нагрузке задержки выше, чем у американских хостингов.

DeepSeek V4 с контекстом 1 миллион токенов ожидается в ближайшие месяцы.

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *