loader

Loss Landscape trong Deep Learning: Vì sao Gradient Descent thường gặp khó khăn? Trong huấn luyện các mô hình học sâu (Deep Learning), đặc biệt là các mạng thần kinh nhiều tầng (DNN, Transformer, CNN), chúng ta phải tối ưu hàm mất mát (loss function) để mô hình học ra trọng số tốt nhất. Tuy […]