关于 actor和critic中softmax各自温度的选择,请问是否有一些大概的规律,比如说为什么critic的温度要比actor大这么多,再比如是否是多样性越高的数据集,温度应该设置的越高呢?
关于 actor和critic中softmax各自温度的选择,请问是否有一些大概的规律,比如说为什么critic的温度要比actor大这么多,再比如是否是多样性越高的数据集,温度应该设置的越高呢?