pytorch Normal dağıtım için anlaşılması log_prob

oy
1

Şu anda sürekli bir eylem alanı vardır openAi jimnastik ortamından Sarkaç-v0 çözmeye çalışıyorum. Sonuç olarak, benim eylemleri örnek bir Normal Dağılım kullanmak gerekir. Ne anlamıyorum bunu kullanarak log_prob boyutudur:

Burada

Boyuta sahip 2 (burada her işlemler için bir log_prob) ama bir çıktı tensörünün boyutu (2,2) bir tensör bekleniyordu.

kesikli çevre için Kategorik dağılımı kullanılarak, ancak log_prob beklenen boyutuna sahiptir. Neden farklı boyutta normal dağılımı için log_prob nedir?

Oluştur 19/03/2020 saat 21:23
kaynak kullanıcı
Diğer dillerde...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more