В январе 2025 года DeepSeek опубликовал модель с ценами, которые переписали рынок. $0.28 за миллион входящих токенов и $1.10 за выходящих — в разы дешевле OpenAI при сопоставимом качестве.
Актуальные модели
deepseek-chat (V3.2) — режим без размышлений. Подходит для классификации, суммаризации, пайплайнов с инструментами. Максимум 8 тысяч токенов на выходе. Контекст — 128 тысяч токенов.
deepseek-reasoner — режим с видимой цепочкой рассуждений CoT. До 64 тысяч токенов на выходе. Лучше для математики, логики, сложного кода.
Ценообразование V3.2
Cache hit (повторяющийся префикс): $0.028 за миллион токенов. Cache miss: $0.28 за миллион. Output: $0.42 за миллион.
Кэш включён по умолчанию. Если запросы начинаются с одного системного промпта — кэш срабатывает автоматически, стоимость падает в 10 раз.
Как подключиться
API совместим с форматом OpenAI. В большинстве проектов достаточно изменить base_url и api_key:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_DEEPSEEK_KEY",
base_url="https://api.deepseek.com"
)
response = client.chat.completions.create(
model="deepseek-chat",
messages=[{"role": "user", "content": "Привет"}]
)
print(response.choices[0].message.content)
Ключ — на platform.deepseek.com. Российские карты принимает через посредников.
Ограничения
Серверы в Китае — важно для проектов с требованиями к локализации данных. При интенсивной нагрузке задержки выше, чем у американских хостингов.
DeepSeek V4 с контекстом 1 миллион токенов ожидается в ближайшие месяцы.
Добавить комментарий