多音字推理优化#488
Conversation
|
备忘: |
|
File /data/docker/liujing04/gpt-vits/mq-vits-s1bert_no_bert_dpo_new_text/text/g2pw/onnx_api.py:86, in G2PWOnnxConverter.init(self, model_dir, style, model_source, enable_non_tradional_chinese) File ~/miniconda3/envs/py39webui/lib/python3.9/site-packages/onnxruntime/capi/onnxruntime_inference_collection.py:360, in InferenceSession.init(self, path_or_bytes, sess_options, providers, provider_options, **kwargs) File ~/miniconda3/envs/py39webui/lib/python3.9/site-packages/onnxruntime/capi/onnxruntime_inference_collection.py:388, in InferenceSession._create_inference_session(self, providers, provider_options, disabled_optimizers) ValueError: This ORT build has ['TensorrtExecutionProvider', 'CUDAExecutionProvider', 'CPUExecutionProvider'] enabled. Since ORT 1.9, you are required to explicitly set the providers parameter when instantiating InferenceSession. For example, onnxruntime.InferenceSession(..., providers=['TensorrtExecutionProvider', 'CUDAExecutionProvider', 'CPUExecutionProvider'], ...) |
|
需要手工指定可用的onnx providers |
self.session_g2pW = onnxruntime.InferenceSession( |
|
试了一下,感觉目前效果还是比pypinyin差了一些,还hai老是认成huan,中zhong1老是变成zhong4,着zhe老是变成zhuo |
有无具体例子? |
|
|
0309更新: @dalan2014 @XXXXRT666 感谢两位大佬帮忙测试,麻烦大佬们再测测重构后的效果 |
|
0313更新: |
实验记录目的• 评估g2pw读对多音字的概率 设置• 实验将在0217、0217-add-g2pw这两个版本中 测试用例• 参考音频:见附录 结果• 括号中✓代表读对×代表读错 0217版 结论• 懒得写了 附录• g2pw推理速度会再慢一些 |
实验记录目的 测试用例 测试结果
|
|
Mac M系列使用opencc: |
直接安装opencc会在开启推理webUI时产生如下报错: |
已修复了 |
same in ubuntu:
|
|
@KamioRinn 多音字效果非常好,赞。但感觉优化过后音调变了 |
|
@RVC-Boss 请问这个分支会merge吗? |
已合并进v2最新代码 |
新增内容:
PaddleSpeech的g2pw实现PaddleSpeech
“和”字拼音转成了han4 GitYCC/g2pW#17 (comment)
pypinyin的g2pw实现pypinyin-g2pW
注意事项: