SakuraLLM
/

Sakura-GalTransl-7B-v3.7

Model card Files Files and versions

xd2333 commited on Mar 26

Commit

a7b02af

·

verified ·

1 Parent(s): 3c463f7

Update README.md

Files changed (1) hide show

README.md +14 -11

README.md CHANGED Viewed

@@ -21,6 +21,20 @@ Sakura-GalTransl模型由sakuraumi和xd2333共同构建，为视觉小说(Galgam
 24.06.30 v1.5：优化了整体的文风
 24.05.30 v1.0：初版
 ### 已知问题：
 * GPT字典**不支持一词多译写法（"a/b"）**，将在以后的版本尝试改善。
 * 需要对原文省略语素进行推理时可能出现事实错误/幻觉。
@@ -35,17 +49,6 @@ Sakura-GalTransl模型由sakuraumi和xd2333共同构建，为视觉小说(Galgam
 | Q5_K | 很小的质量损失（6G/8G显存推荐） |
 | Q6_k | 细小的质量损失（8G及以上显存推荐） |
-### 快速部署：
-* [run_Sakura_any.zip](https://huggingface.co/SakuraLLM/Sakura-GalTransl-7B-v3/blob/main/run_Sakura_any.zip)是同时支持 win、mac N卡、A卡、Apple芯片的最简一键部署包，解压后将模型丢进llm2run文件夹里
-win：双击run_Sakura.exe然后选择模型
-mac：先去 app store 安装 xcode，然后打开终端切换到run_Sakura.exe所在目录，运行`chmod +x run_Sakura.exe llamafile-0.9.1.exe & ./run_Sakura.exe`
-6G 显存 1 线程，8G 及以上显存可以设置 4-10 线程
-* 其他部署方式：
-GUI 部署：[Sakura_Launcher_GUI](https://github.com/PiDanShouRouZhouXD/Sakura_Launcher_GUI)，在 release 里下载
-* 启动失败可能是 8080 端口被占用，可以尝试[找到占用的程序](https://www.runoob.com/w3cnote/windows-finds-port-usage.html)
 ### 请求方式
 v2.5模型兼容sakura 0.10的prompt，推荐温度0.2；Top P 0.8；重复惩罚+0.1

 24.06.30 v1.5：优化了整体的文风
 24.05.30 v1.0：初版
+### 快速部署：
+* [run_Sakura_any.zip](https://huggingface.co/SakuraLLM/Sakura-GalTransl-7B-v3/blob/main/run_Sakura_any.zip)是同时支持 Win/Mac/Linux，N卡/A卡/Apple芯片的简化部署包
+1. 解压后将模型丢进llm2run文件夹里
+2. Win：双击run_Sakura_win.bat然后选择模型
+Mac：先去 app store 安装 xcode，然后打开终端切换到run_Sakura.exe所在目录，运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
+Linux: Linux使用GPU需要安装CUDA SDK或HIP SDK，然后切换到run_Sakura.exe所在目录，运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
+4. 6G 显存 1 线程，8G 及以上显存可以设置 4-10 线程
+* 其他部署方式：
+GUI 部署：[Sakura_Launcher_GUI](https://github.com/PiDanShouRouZhouXD/Sakura_Launcher_GUI)，在 release 里下载
+* 启动失败可能是 8080 端口被占用，可以尝试[找到占用的程序](https://www.runoob.com/w3cnote/windows-finds-port-usage.html)
 ### 已知问题：
 * GPT字典**不支持一词多译写法（"a/b"）**，将在以后的版本尝试改善。
 * 需要对原文省略语素进行推理时可能出现事实错误/幻觉。
 | Q5_K | 很小的质量损失（6G/8G显存推荐） |
 | Q6_k | 细小的质量损失（8G及以上显存推荐） |
 ### 请求方式
 v2.5模型兼容sakura 0.10的prompt，推荐温度0.2；Top P 0.8；重复惩罚+0.1