- Дата публикации
Что появилось / что изменилось NVIDIA добавила в архитектуру GPU Blackwell новый формат чисел для инференса ИИ — NVFP4. Это 4-битный плавающий формат, рассчитанный на работу в тензорных ядрах пятого п...
Новости о FP8-квантизации: ускорение инференса LLM, снижение потребления памяти и GPU.
3 материала