墨奇音形·万象双拼辅助码·白霜拼音
  • 简介
  • 墨奇音形说明
    • 双拼说明
    • 辅助码说明
      • 墨奇码拆分说明
  • 墨奇音形安装
    • 手心挂接
  • 墨奇音形高级功能
    • 不认识的字反查
    • 英语、日语输入
    • emoji输入
    • 火星文
    • 中英互译
    • 超级简拼
    • e简码
    • 模糊音、飞键
    • 使用/字词分离
    • 查看字的拆分(墨奇码独有)
    • 时间、日期输入
    • V键计算器
    • R输入大写数字
    • U直接输入unicode字符
    • 符号、快符
    • 并击
  • 墨奇音形常见问题解答
  • 鸣谢
  • 友情链接
  • 进阶·技术细节
    • 制作白霜词库的过程
    • 每个人都可以训练自己的语言模型
    • 制作墨奇音形任意双拼辅助码
Powered by GitBook
On this page
  1. 进阶·技术细节

每个人都可以训练自己的语言模型

Previous制作白霜词库的过程Next制作墨奇音形任意双拼辅助码

Last updated 10 months ago

感谢rime输入法交流群雨辰、魔然作者ksqsf的研究。

把制作语言模型的步骤写下来,做个备忘。

语言模型简介:

简要步骤:

1 收集语料

5 执行librime-octagram的build_grammar

2 分词,变成txt格式,词和词之间按空格分开 脚本可以参考

3 生成.arpa文件 可以使用开源库

4 把arpa转成librime-octagram的tool用的格式 雨辰提供

https://github.com/gaboolic/rime-frost/blob/master/others/program/mnbvc/yuliao_fenci_to_txt.py
https://github.com/kpu/kenlm
https://github.com/gaboolic/rime-build-grammar/blob/main/arpa.py
https://fancyerii.github.io/dev287x/lm/
GitHub - gaboolic/rime-build-grammar: 生成rime的gram文件GitHub
Logo