Сколько стоит контент, который пишет ИИ? Цифры 2026 года

Мы все привыкли отдавать статьи ИИ. У этой привычки есть счёт. Ниже — сколько реально стоит одна статья среднего размера в основных API на июль 2026 года и с какого объёма этот счёт перестаёт иметь смысл.

Прайс по списку

Цены указаны за 1M токенов в USD, проверены в июле 2026 по официальным страницам провайдеров. За три месяца с апрельской редакции таблица обновилась почти целиком — перед бюджетированием пайплайна сверяйтесь с прайсами.

Провайдер	Модель	Input	Output
Anthropic	Claude Fable 5 (флагман)	$10	$50
	Claude Opus 4.8	$5	$25
	Claude Sonnet 5 (средний)	$3	$15
	Claude Haiku 4.5 (бюджет)	$1	$5
OpenAI	GPT-5.5 Pro (флагман)	$30	$180
	GPT-5.6 Sol	$5	$30
	GPT-5.6 Terra (средний)	$2.50	$15
	GPT-5.6 Luna (бюджет)	$1	$6
Google	Gemini 3.1 Pro	$2.00	$12
	Gemini 3.5 Flash	$1.50	$9
	Gemini 3.1 Flash-Lite	$0.25	$1.50
xAI	Grok 4.5	$2	$6
xAI	Grok 4.3	$1.25	$2.50
DeepSeek	V4 Pro	$0.44	$0.87
DeepSeek	V4 Flash	$0.14	$0.28
Alibaba	Qwen3.7 Max	$2.50	$7.50
	Qwen3.7 Plus	$0.40	$1.60
	Qwen3.6 Flash	$0.25	$1.50
Mistral	Medium 3.5	$1.50	$7.50
	Large 3	$0.50	$1.50
	Small 4	$0.15	$0.60

Output стоит в 2–6 раз дороже input на любом уровне. Это важно: длинная статья — это в основном output-токены. Короткий бриф с длинным системным промптом — в основном input. Две цены идут со звёздочкой: у Claude Sonnet 5 действует вводный прайс ($2/$10) до 31 августа 2026, а у Gemini Pro цена примерно удваивается на контексте свыше 200K токенов ($4/$18 у 3.1 Pro) — длинный контекст обходится дороже заголовочной цифры.

Сколько реально стоит одна статья

Статья среднего размера — около 2500 слов — укладывается примерно в 3000 input-токенов (системный промпт, бриф, инструкции по шаблону, исходники) и 3500 output-токенов (≈2500 слов). Получаем:

Модель	Прайс-лист	С кэшем (скидка на чтение)	Кэш + batch
GPT-5.5 Pro	~$0.72	n/a	~$0.36
Claude Fable 5	~$0.21	~$0.18	~$0.089
GPT-5.6 Sol	~$0.12	~$0.11	~$0.053
Claude Opus 4.8	~$0.10	~$0.089	~$0.045
Claude Sonnet 5	~$0.062	~$0.053	~$0.027
GPT-5.6 Terra	~$0.060	~$0.053	~$0.027
Gemini 3.1 Pro	~$0.048	~$0.043	~$0.021
Gemini 3.5 Flash	~$0.036	~$0.032	~$0.016
Qwen3.7 Max	~$0.034	~$0.030	~$0.015
Mistral Medium 3.5	~$0.031	~$0.027	~$0.013
Grok 4.5	~$0.027	~$0.023	~$0.018 (batch −20%)
GPT-5.6 Luna	~$0.024	~$0.021	~$0.011
Claude Haiku 4.5	~$0.021	~$0.018	~$0.009
Mistral Large 3	~$0.0068	~$0.0054	~$0.0027
Gemini 3.1 Flash-Lite	~$0.006	~$0.0053	~$0.0027
DeepSeek V4 Pro	~$0.0044	~$0.0031	n/a
Mistral Small 4	~$0.0026	~$0.0021	~$0.0011
DeepSeek V4 Flash	~$0.0014	~$0.001	n/a

Бюджетный уровень вроде Haiku, Luna или Gemini Flash-Lite укладывает статью в пару центов по прайсу. DeepSeek V4 Flash уходит к десятой доле цента. Настоящий флагман вроде GPT-5.5 Pro — это примерно в 500 раз дороже DeepSeek и примерно в 12 раз дороже среднего уровня вроде Sonnet 5 или GPT-5.6 Terra.

Скидки, которые реально работают

Два механизма имеют значение для всех, кто гонит ИИ-контент в объёме, — но оба стали заметно условнее, чем весной:

Prompt caching. Anthropic, OpenAI, Google, xAI, DeepSeek, Alibaba и Mistral дают скидку на чтение закэшированного input: обычно −90% (Anthropic, OpenAI, Google, Mistral), −75…84% (xAI), −50% (Alibaba) и до −98% у DeepSeek, чья цена cache-hit — самый мощный рычаг на этой странице. Подвох с другой стороны: запись в кэш теперь стоит с наценкой (Anthropic берёт 1.25× при TTL 5 минут и 2× при часовом; OpenAI добавил наценку 1.25× на запись в семействе GPT-5.6). Кэш окупается только тогда, когда закэшированный префикс реально перечитывается несколько раз.
Batch API. Anthropic, OpenAI, Google, Alibaba и Mistral дают −50% на async-задачи, завершающиеся в течение 24 часов. Универсальными эти 50% быть перестали: xAI скидывает только 20%, а DeepSeek batch-скидку не публикует вовсе — его прежнее off-peak-окно (−50…75% по времени суток) исчезло из прайса вместе с поколением V4.

Там, где есть оба механизма, они складываются. Batch + кэш — это примерно −95% на input и −50% на output относительно прайса. Если вы гоните контент плановыми пачками с фиксированным системным промптом, и то и другое нужно использовать.

Математика на объёме

Возьмём разумный средний уровень — Claude Sonnet 5 по прайсу, $0.062 за статью:

Объём	Pure-AI (генерим каждую заново)	AI-шаблон один раз + локальный рендер
1 статья	$0.06	$0.06
100 статей	~$6.15	~$0.06
1 000 статей	~$61.50	~$0.06
10 000 статей	~$615	~$0.06

Против флагмана вроде GPT-5.5 Pro разрыв больше: 10 000 статей обойдутся примерно в $7 200 по прайсу против стоимости одной качественной генерации шаблона (заметно меньше $1) и бесплатного локального рендера. Вот момент, когда счёт перестаёт иметь смысл.

Модельный ряд меняется быстрее вашего контент-плана

Есть ещё одна статья расходов, которой нет ни в одном прайсе. Каждая модель из апрельской редакции этой статьи — GPT-5.4, Gemini 3 Flash, Grok 4, DeepSeek V3 и R1, Qwen3 Max, Mistral Small 3.1, Claude Opus 4.7 и Sonnet 4.6 — с тех пор переименована, заменена следующим поколением или объявлена устаревшей. Три месяца. OpenAI отказался от цифровых уровней в пользу именованных (Sol / Terra / Luna). DeepSeek просто снял с поддержки алиасы deepseek-chat и deepseek-reasoner.

Если ваш пайплайн зовёт модель на каждый рендер, любое из этих изменений — это миграция: новые ID моделей, перенастройка промптов, пересчёт бюджета и текст, который читается не так, как в прошлом квартале. Если пайплайн зовёт модель один раз, чтобы написать шаблон, а дальше рендерит локально — вас это не касается вообще. Скорость смены моделей — это аргумент в пользу шаблона, а не просто неудобство.

Когда логично платить за каждую статью

Не каждая статья — повтор. Платить за каждую генерацию разумно, когда это:

редакционные тексты с уникальным голосом или углом;
новые темы, в которых модель реально «проводит исследование»;
лонгриды, где нюанс важнее объёма;
черновики, которые вы всё равно будете сильно редактировать руками.

Для такой работы нужен лучший доступный вам уровень модели. Качество флагмана окупается экономией времени на редактуре.

Когда платить один раз и рендерить много

Экономика разворачивается в момент, когда вам нужно выдавать одну и ту же форму статьи больше нескольких раз:

страницы товаров по каталогу SKU;
локализованные варианты по языкам и регионам;
SEO-лендинги под длинный список ключей;
multi-tenant SaaS-маркетинг с общей структурой;
всё, где структура постоянна, а меняются только факты.

Здесь платить за каждый рендер — чистые потери. Шаблон пишется один раз с ИИ, рендер уходит в инструмент, который делает это бесплатно.

Гибридный workflow

Именно под этот сценарий сделан Spintax:

Заплатить флагману один раз. Берёте лучшую доступную модель — Fable 5, Opus 4.8, GPT-5.6 Sol, Gemini 3.1 Pro — для написания шаблона. Платите $0.05–$1 и получаете качественный, грамматически безопасный, мультивариантный шаблон.
Рендерите бесконечно — локально. Spintax раскрывает шаблон на вашем CPU. Тысячи вариантов стоят практически ноль.
Обновляете шаблон, когда меняется смысл. Перегенерируйте только когда меняются факты или позиционирование, — а не когда вендор переименовал модель. Для стабильного продукта — раз в квартал.

Платите за качество там, где оно важно. Перестаёте платить за количество.

Оговорки

Меняются и цены, и названия. Таблица выше обновилась целиком между апрелем и июлем 2026. Сверяйтесь с прайсами перед бюджетированием и никогда не зашивайте в код ID модели, который вы не перепроверили в этом квартале.
Запись в кэш не бесплатна. Заголовочные «−90%» относятся к чтению кэша. Anthropic и OpenAI берут наценку за запись, Google — почасовую плату за хранение. Кэш, который прочитали один раз, дороже, чем отсутствие кэша.
Batch — не везде 50%. У xAI — 20%. У DeepSeek batch-скидки нет в прайсе вообще. Не считайте стек скидок, пока не проверили.
Длинный контекст у части провайдеров дороже. У Gemini Pro цена примерно удваивается после 200K токенов. Anthropic и OpenAI держат плоский тариф по всему контекстному окну.
Качество разное на разных уровнях. Бюджетные модели нормальны для скелетов и переписываний. Тонкий голос, long-context и фактическая точность — всё ещё территория флагманов. Используйте дешёвые модели для локального рендера, а не для самого шаблона.

Что читать дальше

Готовы превратить одну хорошую AI-генерацию в тысячи рендеров? Начните с серии гайдов по написанию:

Источники данных: страницы цен Anthropic, OpenAI, Google, xAI, DeepSeek, Alibaba, Mistral — проверены 2026-07-13. Расчёт «на статью» сделан из 3000 input + 3500 output токенов.

Открыть в песочнице Ко всем гайдам