@@ -10,29 +10,29 @@ LogMelSpectrogram
1010参数
1111::::::::::::
1212
13- - **sr ** (int) - 采样率,默认 22050。
14- - **n_fft ** (int) - 离散傅里叶变换中频率窗大小,默认 512。
13+ - **sr ** (int,可选 ) - 采样率,默认 22050。
14+ - **n_fft ** (int,可选 ) - 离散傅里叶变换中频率窗大小,默认 512。
1515 - **hop_length ** (int,可选) - 帧移,默认 512。
1616 - **win_length ** (int,可选) - 短时 FFT 的窗长,默认为 None。
17- - **window ** (str) - 窗函数名,默认'hann'。
18- - **power ** (float) - 幅度谱的指数。
19- - **center ** (bool) - 对输入信号填充,如果 True,那么 t 以 t*hop_length 为中心,如果为 False,则 t 以 t*hop_length 开始。
20- - **pad_mode ** (str) - 如果 center 是 True,选择填充的方式,默认值是'reflect'。
21- - **n_mels ** (int) - mel bins 的数目。
17+ - **window ** (str,可选 ) - 窗函数名,默认'hann'。
18+ - **power ** (float,可选 ) - 幅度谱的指数,默认是2.0 。
19+ - **center ** (bool,可选 ) - 对输入信号填充,如果 True,那么 t 以 t*hop_length 为中心,如果为 False,则 t 以 t*hop_length 开始,默认是 True 。
20+ - **pad_mode ** (str,可选 ) - 如果 center 是 True,选择填充的方式,默认值是'reflect'。
21+ - **n_mels ** (int,可选 ) - mel bins 的数目,默认是64 。
2222 - **f_min ** (float,可选) - 最小频率(hz),默认 50.0。
2323 - **f_max ** (float,可选) - 最大频率(hz),默认为 None。
24- - **htk ** (bool,可选) - 在计算 fbank 矩阵时是否用在 HTK 公式缩放.
25- - **norm ** (Union[str,float],可选) - 计算 fbank 矩阵时正则化的种类,默认是'slaney',你也可以 norm=0.5,使用 p-norm 正则化.
26- - **ref_value ** (float) - 参照值, 如果小于 1.0,信号的 db 会被提升,相反 db 会下降,默认值为 1.0.
27- - **amin ** (float) - 输入的幅值的最小值.
28- - **top_db ** (float,可选) - log-mel 谱的最大值(db).
29- - **dtype ** (str) - 输入和窗的数据类型,默认是'float32'.
24+ - **htk ** (bool,可选) - 在计算 fbank 矩阵时是否用在 HTK 公式缩放,默认是 False。
25+ - **norm ** (Union[str,float],可选) - 计算 fbank 矩阵时正则化的种类,默认是'slaney',你也可以 norm=0.5,使用 p-norm 正则化。
26+ - **ref_value ** (float,可选 ) - 参照值, 如果小于 1.0,信号的 db 会被提升,相反 db 会下降,默认值为 1.0。
27+ - **amin ** (float,可选 ) - 输入的幅值的最小值,默认是1e-10。
28+ - **top_db ** (float,可选) - log-mel 谱的最大值(db),默认是None。
29+ - **dtype ** (str,可选 ) - 输入和窗的数据类型,默认是'float32'。
3030
3131
3232返回
3333:::::::::
3434
35- 计算``LogMelSpectrogram``的可调用对象.
35+ 计算``LogMelSpectrogram``的可调用对象。
3636
3737代码示例
3838:::::::::
0 commit comments