- Дата публикации
Что нового AWS показала, как выжать больше производительности из своих чипов Trainium2 для генеративных моделей с длинными ответами за счёт speculative decoding в связке с vLLM и Kubernetes. Ключевые ...
Новости Amazon Web Services в сфере ИИ: Bedrock, SageMaker, Titan и облачные ИИ-сервисы.
9 материалов