Update README.md
Browse files
README.md
CHANGED
|
@@ -11,8 +11,8 @@ Sakura-GalTransl模型由sakuraumi和xd2333共同构建,为视觉小说(Galgam
|
|
| 11 |
### 特性:
|
| 12 |
* 为视觉小说(Galgame)翻译任务专项优化。对视觉小说脚本中的行内换行、控制符、ruby注音等符号具有较好的保留能力。
|
| 13 |
* 尝试在硬件需求、翻译质量与稳定性间取得平衡。模型可以运行在(空闲显存≥6g)的主流游戏显卡或Macbook上,并获得在整体上高度可用的翻译质量和稳定性。
|
| 14 |
-
* 为[GalTransl视觉小说翻译工具](https://github.com/xd2333/GalTransl)
|
| 15 |
-
*
|
| 16 |
|
| 17 |
### 更新日志:
|
| 18 |
25.05.30 v3.5:强化文学性
|
|
@@ -34,22 +34,7 @@ Mac:先去 app store 安装 xcode,然后打开终端切换到run_Sakura.exe
|
|
| 34 |
Linux: Linux使用GPU需要安装CUDA SDK或HIP SDK,然后切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
|
| 35 |
4. 6G 显存 1 线程,8G 及以上显存可以设置 4-10 线程
|
| 36 |
|
| 37 |
-
* 启动失败可能是 8080 端口被占用,可以尝试[
|
| 38 |
-
|
| 39 |
-
### 已知问题:
|
| 40 |
-
* GPT字典**不支持一词多译写法("a/b")**,将在以后的版本尝试改善。
|
| 41 |
-
* 需要对原文省略语素进行推理时可能出现事实错误/幻觉。
|
| 42 |
-
* 推荐每次翻译**7-10句**
|
| 43 |
-
|
| 44 |
-
### 量化等级区别:
|
| 45 |
-
|
| 46 |
-
| 量化等级 | 说明 |
|
| 47 |
-
| ---- | ---- |
|
| 48 |
-
| IQ4_XS | 小的质量损失,占用更小,但速度比Q4_K慢(6G显存推荐) |
|
| 49 |
-
| Q4_K | 小的质量损失(6G显存推荐)|
|
| 50 |
-
| Q5_K | 很小的质量损失(6G/8G显存推荐) |
|
| 51 |
-
| Q6_k | 细小的质量损失(8G及以上显存推荐) |
|
| 52 |
-
|
| 53 |
|
| 54 |
### 请求方式
|
| 55 |
|
|
@@ -102,4 +87,18 @@ v3请求模板:
|
|
| 102 |
柑奈「……你是为了我特意移动到这边的吧。谢谢」
|
| 103 |
一诚「啊,不,那个……」
|
| 104 |
柑奈「呵呵,在学校里看到的小泷明明那么不可靠呢」
|
| 105 |
-
```
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 11 |
### 特性:
|
| 12 |
* 为视觉小说(Galgame)翻译任务专项优化。对视觉小说脚本中的行内换行、控制符、ruby注音等符号具有较好的保留能力。
|
| 13 |
* 尝试在硬件需求、翻译质量与稳定性间取得平衡。模型可以运行在(空闲显存≥6g)的主流游戏显卡或Macbook上,并获得在整体上高度可用的翻译质量和稳定性。
|
| 14 |
+
* 为[GalTransl视觉小说翻译工具](https://github.com/xd2333/GalTransl)适配,支持GPT字典([字典写法](https://github.com/xd2333/GalTransl/wiki/GPT%E5%AD%97%E5%85%B8%E2%80%90Sakura%E4%B8%8EGaltransl%E6%A8%A1%E5%9E%8B))。
|
| 15 |
+
* 支持使用[lunatranslator](https://docs.lunatranslator.org/zh/)等工具hook在线翻译。
|
| 16 |
|
| 17 |
### 更新日志:
|
| 18 |
25.05.30 v3.5:强化文学性
|
|
|
|
| 34 |
Linux: Linux使用GPU需要安装CUDA SDK或HIP SDK,然后切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
|
| 35 |
4. 6G 显存 1 线程,8G 及以上显存可以设置 4-10 线程
|
| 36 |
|
| 37 |
+
* 启动失败可能是 8080 端口被占用,可以尝试[找到占用端口的程序](https://www.runoob.com/w3cnote/windows-finds-port-usage.html)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 38 |
|
| 39 |
### 请求方式
|
| 40 |
|
|
|
|
| 87 |
柑奈「……你是为了我特意移动到这边的吧。谢谢」
|
| 88 |
一诚「啊,不,那个……」
|
| 89 |
柑奈「呵呵,在学校里看到的小泷明明那么不可靠呢」
|
| 90 |
+
```
|
| 91 |
+
|
| 92 |
+
### 已知问题:
|
| 93 |
+
* GPT字典**不支持一词多译写法("a/b")**,将在以后的版本尝试改善。
|
| 94 |
+
* 需要对原文省略语素进行推理时可能出现事实错误/幻觉。
|
| 95 |
+
* 推荐每次翻译**7-10句**
|
| 96 |
+
|
| 97 |
+
### 量化等级区别:
|
| 98 |
+
|
| 99 |
+
| 量化等级 | 说明 |
|
| 100 |
+
| ---- | ---- |
|
| 101 |
+
| IQ4_XS | 小的质量损失,占用更小,但速度比Q4_K慢(6G显存推荐) |
|
| 102 |
+
| Q4_K | 小的质量损失(6G显存推荐)|
|
| 103 |
+
| Q5_K | 很小的质量损失(6G/8G显存推荐) |
|
| 104 |
+
| Q6_k | 细小的质量损失(8G及以上显存推荐) |
|