date

NVIDIA представила GPU для моделей с длинным контекстом

NVIDIA представила GPU для моделей с длинным контекстом

Компания NVIDIA представила новый графический процессор GB200, разработанный специально для долгого контекстного инференса, сообщает TechCrunch. Чип ориентирован на использование в больших языковых моделях и генеративном ИИ.

GB200 способен обрабатывать до 1 миллиона токенов в одном запросе. Это даёт моделям возможность дольше “помнить” контекст и логично продолжать большие тексты — особенно полезно при генерации кода, обработке документов и длинных диалогах.

Чип построен на архитектуре GH200 Grace Hopper Superchip. Она обеспечивает высокую производительность, энергоэффективность и масштабируемость для LLM. Серверы на базе GB200 ожидаются на рынке в 2026 году.

Ctrl
Enter
Нашли оШибку
Выделите текст и нажмите Ctrl+Enter
Новости » Технологии » NVIDIA представила GPU для моделей с длинным контекстом