1.4 KiB
1.4 KiB
"Тензорные ядра CUDA для глубокого обучения"
- С помощью фреймворка PyTorch реализовать архитектуру AlexNet для распознавания изображений из набора данных CIFAR10.
- Обучить модель с помощью GPU на тренировочном наборе данных в двух режимах — без использования тензорных CUDA-ядер (FP32) и с их использованием (FP16).
- Эксперимент 1: сравнить время обучения модели в разных режимах.
- Эксперимент 2: сравнить точности распознавания изображений из тестового набора данных при разных режимах обучения модели.
- Эксперимент 3: сравнить реальные вычислительные сложности пакетного умножения матриц (Batch Matrix Multiplication) на GPU а режимах FP32 и FP16; построить графики сложностей.
- Объяснить результаты вычислительных экспериментов.
Отчет должен содержать: исходный код, результаты экспериментов, обсуждение полученных результатов.