DeepSeek V4 проходит тесты на OpenRouter

Две бесплатные AI-модели, Hunter Alpha и Healer Alpha, появились на OpenRouter 11 марта без какого-либо публичного объявления. Платформа обозначила их только как «скрытые модели», без имени разработчика, пресс-релиза или записи в блоге. Этот тихий запуск быстро привлек внимание после того, как Hunter Alpha обработала более 160 миллиардов токенов за неделю, что заставило разработчиков задаться вопросом, не тестирует ли DeepSeek публично свою следующую флагманскую модель. Об этом сообщает Habr.com.
Согласно странице на OpenRouter, Hunter Alpha имеет 1 триллион параметров и контекстное окно в 1 миллион токенов. Она описывается как модель, созданная для агентного стиля работы, включая длительное планирование, сложные рассуждения и многоэтапные задачи. Healer Alpha представлена как мультимодальный компаньон, способный работать с текстом, изображениями и аудио, с контекстным окном на 262 000 токенов.
Reuters сообщило, что чат-бот описал себя как китайскую AI-модель, обученную в основном на китайском языке, с отсечкой знаний в мае 2025 года. Некоторые исследователи говорят, что её стиль рассуждения и системные подсказки, включая формулировки о строгом соблюдении китайского законодательства, напоминают модели китайской разработки и соответствуют ожиданиям от DeepSeek V4, который, как ожидают некоторые местные СМИ, выйдет в апреле.
Другие остаются неубеждёнными. Независимые тестировщики говорят, что поведение модели с токенами, шаблоны цензуры и более слабые результаты в математике не полностью соответствуют прежним системам DeepSeek. Другая теория указывает на Zhipu AI, поскольку тот же анонимный поставщик OpenRouter ранее выпустил Pony Alpha, которая позже оказалась ранней моделью GLM-5. На данный момент личность тех, кто стоит за Hunter Alpha и Healer Alpha, остаётся неподтверждённой.
Читайте «Zamin» в Telegram!