Компания NVIDIA представила новый графический процессор GB200, разработанный специально для долгого контекстного инференса, сообщает TechCrunch. Чип ориентирован на использование в больших языковых моделях и генеративном ИИ.
GB200 способен обрабатывать до 1 миллиона токенов в одном запросе. Это даёт моделям возможность дольше “помнить” контекст и логично продолжать большие тексты — особенно полезно при генерации кода, обработке документов и длинных диалогах.
Чип построен на архитектуре GH200 Grace Hopper Superchip. Она обеспечивает высокую производительность, энергоэффективность и масштабируемость для LLM. Серверы на базе GB200 ожидаются на рынке в 2026 году.
Читайте «Замин» в Telegram!Ctrl
Enter
Нашли оШибку
Выделите текст и нажмите Ctrl+Enter
Новости по теме