Update README.md
Browse files
README.md
CHANGED
|
@@ -21,6 +21,20 @@ Sakura-GalTransl模型由sakuraumi和xd2333共同构建,为视觉小说(Galgam
|
|
| 21 |
24.06.30 v1.5:优化了整体的文风
|
| 22 |
24.05.30 v1.0:初版
|
| 23 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 24 |
### 已知问题:
|
| 25 |
* GPT字典**不支持一词多译写法("a/b")**,将在以后的版本尝试改善。
|
| 26 |
* 需要对原文省略语素进行推理时可能出现事实错误/幻觉。
|
|
@@ -35,17 +49,6 @@ Sakura-GalTransl模型由sakuraumi和xd2333共同构建,为视觉小说(Galgam
|
|
| 35 |
| Q5_K | 很小的质量损失(6G/8G显存推荐) |
|
| 36 |
| Q6_k | 细小的质量损失(8G及以上显存推荐) |
|
| 37 |
|
| 38 |
-
### 快速部署:
|
| 39 |
-
* [run_Sakura_any.zip](https://huggingface.co/SakuraLLM/Sakura-GalTransl-7B-v3/blob/main/run_Sakura_any.zip)是同时支持 win、mac N卡、A卡、Apple芯片的最简一键部署包,解压后将模型丢进llm2run文件夹里
|
| 40 |
-
win:双击run_Sakura.exe然后选择模型
|
| 41 |
-
mac:先去 app store 安装 xcode,然后打开终端切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile-0.9.1.exe & ./run_Sakura.exe`
|
| 42 |
-
6G 显存 1 线程,8G 及以上显存可以设置 4-10 线程
|
| 43 |
-
|
| 44 |
-
* 其他部署方式:
|
| 45 |
-
GUI 部署:[Sakura_Launcher_GUI](https://github.com/PiDanShouRouZhouXD/Sakura_Launcher_GUI),在 release 里下载
|
| 46 |
-
|
| 47 |
-
* 启动失败可能是 8080 端口被占用,可以尝试[找到占用的程序](https://www.runoob.com/w3cnote/windows-finds-port-usage.html)
|
| 48 |
-
|
| 49 |
|
| 50 |
### 请求方式
|
| 51 |
v2.5模型兼容sakura 0.10的prompt,推荐温度0.2;Top P 0.8;重复惩罚+0.1
|
|
|
|
| 21 |
24.06.30 v1.5:优化了整体的文风
|
| 22 |
24.05.30 v1.0:初版
|
| 23 |
|
| 24 |
+
### 快速部署:
|
| 25 |
+
* [run_Sakura_any.zip](https://huggingface.co/SakuraLLM/Sakura-GalTransl-7B-v3/blob/main/run_Sakura_any.zip)是同时支持 Win/Mac/Linux,N卡/A卡/Apple芯片的简化部署包
|
| 26 |
+
|
| 27 |
+
1. 解压后将模型丢进llm2run文件夹里
|
| 28 |
+
2. Win:双击run_Sakura_win.bat然后选择模型
|
| 29 |
+
Mac:先去 app store 安装 xcode,然后打开终端切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
|
| 30 |
+
Linux: Linux使用GPU需要安装CUDA SDK或HIP SDK,然后切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
|
| 31 |
+
4. 6G 显存 1 线程,8G 及以上显存可以设置 4-10 线程
|
| 32 |
+
|
| 33 |
+
* 其他部署方式:
|
| 34 |
+
GUI 部署:[Sakura_Launcher_GUI](https://github.com/PiDanShouRouZhouXD/Sakura_Launcher_GUI),在 release 里下载
|
| 35 |
+
|
| 36 |
+
* 启动失败可能是 8080 端口被占用,可以尝试[找到占用的程序](https://www.runoob.com/w3cnote/windows-finds-port-usage.html)
|
| 37 |
+
|
| 38 |
### 已知问题:
|
| 39 |
* GPT字典**不支持一词多译写法("a/b")**,将在以后的版本尝试改善。
|
| 40 |
* 需要对原文省略语素进行推理时可能出现事实错误/幻觉。
|
|
|
|
| 49 |
| Q5_K | 很小的质量损失(6G/8G显存推荐) |
|
| 50 |
| Q6_k | 细小的质量损失(8G及以上显存推荐) |
|
| 51 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 52 |
|
| 53 |
### 请求方式
|
| 54 |
v2.5模型兼容sakura 0.10的prompt,推荐温度0.2;Top P 0.8;重复惩罚+0.1
|