xd2333's picture
Update README.md
e0a2587 verified
|
raw
history blame
5.36 kB
---
license: cc-by-nc-sa-4.0
language:
- zh
---
Sakura-GalTransl模型由sakuraumi和xd2333共同构建,为视觉小说(Galgame)翻译任务专项优化。模型参数量7B,支持日译简中(jp2zh-cn)。
**Sakura-GalTransl模型继承sakura模型cc-by-nc-sa 4.0协议,禁止用于商用行为,例如提供付费翻译接口、制作需要以任何方式付费才能获取的补丁、商用翻译等。**
### 特性:
* 为视觉小说(Galgame)翻译任务专项优化。对视觉小说脚本中的行内换行、控制符、ruby注音等符号具有较好的保留能力。
* 尝试在硬件需求、翻译质量与稳定性间取得平衡。模型可以运行在(空闲显存≥6g)的主流游戏显卡或Macbook上,并获得在整体上高度可用的翻译质量和稳定性。
* 适配[GalTransl](https://github.com/xd2333/GalTransl)翻译工具制作翻译补丁。
* 适配[lunatranslator](https://docs.lunatranslator.org/zh/)翻译器hook游戏在线翻译。
### 更新日志:
2025.08-v3.7:通过改进的强化学习改善了整体准确性与流畅度,并修正了部分已知的控制符号保留问题。注:不带后缀的版本(Sakura-Galtransl-7B-v3.7.gguf)量化等级为Q6_K
2025.05-v3.5:强化文学性
2025.03-v3.0:基于Sakura-7B-Qwen2.5-v1.0并使用GRPO对模型进行强化,翻译质量显著优于上一代GalTransl模型
2024.10-v2.6:在2.5的基础上提高了稳定性
2024.09-v2.5:抑制了一些已知问题,并且在对比v2时文风更细腻
2024.08-v2.0:继续迭代以改善质量
2024.06-v1.5:优化了整体的文风
2024.05-v1.0:初版
### 快速部署:
* Win建议使用[Sakura_Launcher_GUI](https://github.com/PiDanShouRouZhouXD/Sakura_Launcher_GUI)部署,在 release 里下载
* Mac可以使用[run_Sakura_any.zip](https://huggingface.co/SakuraLLM/Sakura-GalTransl-7B-v3/blob/main/run_Sakura_any.zip),是同时支持 Win/Mac/Linux,N卡/A卡/Apple芯片的简化部署包
1. 解压后将模型丢进llm2run文件夹里
2. Win:双击run_Sakura_win.bat然后选择模型
Mac:先去 app store 安装 xcode,然后打开终端切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
Linux: Linux使用GPU需要安装CUDA SDK或HIP SDK,然后切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
4. 6G 显存 1 线程,8G 及以上显存可以设置 4-10 线程
* 启动失败可能是 8080 端口被占用,可以尝试[找到占用端口的程序](https://www.runoob.com/w3cnote/windows-finds-port-usage.html)
### 请求方式
v3推荐温度0.3,top_p 0.8
v3请求模板:
系统提示/system prompt
```
你是一个视觉小说翻译模型,可以通顺地使用给定的术语表以指定的风格将日文翻译成简体中文,并联系上下文正确使用人称代词,注意不要混淆使役态和被动态的主语和宾语,不要擅自添加原文中没有的特殊符号,也不要擅自增加或减少换行。
```
用户输入/user prompt
```
[History]
参考以下术语表(可为空,格式为src->dst #备注):
[Glossary]
根据以上术语表的对应关系和备注,结合历史剧情和上下文,将下面的文本从日文翻译成简体中文:
[Input]
```
其中[History]格式为`历史翻译:`+上一轮翻译结果
[Glossary]格式为src->dst #备注
这两项都是可选项,可以留空
* 用户输入示例
```
历史翻译:流动泳池里经常会发生这种碰撞。
男方也向四木道歉了。
不过四木的个子很小,要是被大大的充气船或游泳圈卷进去就糟了。
一诚「我们到人少一点的地方去吧。」
我护着四木,将她带到安全的地方。
参考以下术语表(可为空,格式为src->dst #备注):
子供->孩子
柑奈->柑奈 #女角色名
タッキー->小泷 #名称,男生,玩家
一誠->一诚 #主角,男生,昵称
根据以上术语表的对应关系和备注,结合历史剧情和上下文,将下面的文本从日文翻译成简体中文:
この辺なら大丈夫かな?
前後に小さな子供がいるけど浮き輪は着けてないな。
柑奈「……あたしのために移動してくれたんだよね。ありがと」
一誠「あ、いや、まあ……」
柑奈「ふふ、学園とかで見るタッキーは頼りないのに」
```
* 模型输出示例
```
这边应该没问题吧?
虽然前面和后面有小孩子,但他们没有戴游泳圈。
柑奈「……你是为了我特意移动到这边的吧。谢谢」
一诚「啊,不,那个……」
柑奈「呵呵,在学校里看到的小泷明明那么不可靠呢」
```
### 已知问题:
* GPT字典**不支持一词多译写法("a/b")**,将在以后的版本尝试改善。
* 需要对原文省略语素进行推理时可能出现事实错误/幻觉。
* 推荐每次翻译**7-10句**
### 量化等级区别:
| 量化等级 | 说明 |
| ---- | ---- |
| IQ4_XS | 小的质量损失,占用更小,但速度比Q4_K慢(6G显存推荐) |
| Q4_K | 小的质量损失(6G显存推荐)|
| Q5_K | 很小的质量损失(6G/8G显存推荐) |
| Q6_k | 细小的质量损失(8G及以上显存推荐) |