解决在 yolov8 训练自己的数据集时,matplotlib 中文乱码问题
解决在 yolov8 训练自己的数据集时,matplotlib 中文乱码问题
woodwhales在 yolov8 训练自己的数据集时,如果 class 字典使用了中文,则在训练过程中会出现形如下面的警告:
1 | C:\Users\woodwhales\AppData\Roaming\Python\Python311\site-packages\ultralytics\utils\metrics.py:427: UserWarning: Glyph 26222 (\N{CJK UNIFIED IDEOGRAPH-666E}) missing from current font. |
步骤1:找到 matplotlib 的字体文件目录
执行下述 python 脚本:
1 | import matplotlib |
执行上述脚本后,可以看到 matplotlibrc 文件的所在目录:
1 | C:\programs\anaconda3\Lib\site-packages\matplotlib\mpl-data\matplotlibrc |
步骤2:将中文字体保存到 matplotlib
在步骤1 的基础上,可以得到 matplotlib 的文件根目录是:C:\programs\anaconda3\Lib\site-packages\matplotlib\mpl-data,那么字体文件目录就在 C:\programs\anaconda3\Lib\site-packages\matplotlib\mpl-data\fonts\ttf
在 ttf 文件目录中拷贝中文字体,格式要求为 ttf,笔者使用的是微软雅黑,可以在这里下载:Microsoft YaHei.zip
windows系统中都有微软雅黑,文件目录为:C:\Windows\Fonts,但是其格式为 ttc,可以使用这个网站在线转换为 ttf:https://transfonter.org/ttc-unpack
步骤3:清除 matplotlib 缓存
执行下述 python 脚本:
1 | import shutil |
步骤4:检查中文字体是否生效
执行下述 python 脚本:
1 | import matplotlib.font_manager |
可以得到对应字体信息:
1 | [FontEntry(fname='C:\\programs\\anaconda3\\Lib\\site-packages\\matplotlib\\mpl-data\\fonts\\ttf\\Microsoft YaHei.ttf', name='Microsoft YaHei', style='normal', variant='normal', weight=400, stretch='normal', size='scalable'), FontEntry(fname='C:\\Windows\\Fonts\\msyhbd.ttc', name='Microsoft YaHei', style='normal', variant='normal', weight=700, stretch='normal', size='scalable'), FontEntry(fname='C:\\Windows\\Fonts\\msyh.ttc', name='Microsoft YaHei', style='normal', variant='normal', weight=400, stretch='normal', size='scalable'), FontEntry(fname='C:\\Windows\\Fonts\\msyhl.ttc', name='Microsoft YaHei', style='normal', variant='normal', weight=290, stretch='normal', size='scalable')] |
步骤5:matplotlib 使用中文字体
在训练集脚本的最开始,增加如下代码:
1 | import matplotlib |