视频门户网站建设方案,岳阳建站公司,互联网网站开发创业计划书,地方门户网站模版我们都知道softmax公式如下#xff1a; 但有些softmax公式是先将每个x_i减去x中的最大值再代入以上公式
原因是为了防止上溢和下溢
举个例子#xff0c;x[100000,100001,100002],如果直接代入上式数值会非常大#xff0c;当对每个x的值减去x中的最大值后得到[-2,-1,0] 但有些softmax公式是先将每个x_i减去x中的最大值再代入以上公式
原因是为了防止上溢和下溢
举个例子x[100000,100001,100002],如果直接代入上式数值会非常大当对每个x的值减去x中的最大值后得到[-2,-1,0]此时再代入上式