xd2333 commited on
Commit
a7b02af
·
verified ·
1 Parent(s): 3c463f7

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +14 -11
README.md CHANGED
@@ -21,6 +21,20 @@ Sakura-GalTransl模型由sakuraumi和xd2333共同构建,为视觉小说(Galgam
21
  24.06.30 v1.5:优化了整体的文风
22
  24.05.30 v1.0:初版
23
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
24
  ### 已知问题:
25
  * GPT字典**不支持一词多译写法("a/b")**,将在以后的版本尝试改善。
26
  * 需要对原文省略语素进行推理时可能出现事实错误/幻觉。
@@ -35,17 +49,6 @@ Sakura-GalTransl模型由sakuraumi和xd2333共同构建,为视觉小说(Galgam
35
  | Q5_K | 很小的质量损失(6G/8G显存推荐) |
36
  | Q6_k | 细小的质量损失(8G及以上显存推荐) |
37
 
38
- ### 快速部署:
39
- * [run_Sakura_any.zip](https://huggingface.co/SakuraLLM/Sakura-GalTransl-7B-v3/blob/main/run_Sakura_any.zip)是同时支持 win、mac N卡、A卡、Apple芯片的最简一键部署包,解压后将模型丢进llm2run文件夹里
40
- win:双击run_Sakura.exe然后选择模型
41
- mac:先去 app store 安装 xcode,然后打开终端切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile-0.9.1.exe & ./run_Sakura.exe`
42
- 6G 显存 1 线程,8G 及以上显存可以设置 4-10 线程
43
-
44
- * 其他部署方式:
45
- GUI 部署:[Sakura_Launcher_GUI](https://github.com/PiDanShouRouZhouXD/Sakura_Launcher_GUI),在 release 里下载
46
-
47
- * 启动失败可能是 8080 端口被占用,可以尝试[找到占用的程序](https://www.runoob.com/w3cnote/windows-finds-port-usage.html)
48
-
49
 
50
  ### 请求方式
51
  v2.5模型兼容sakura 0.10的prompt,推荐温度0.2;Top P 0.8;重复惩罚+0.1
 
21
  24.06.30 v1.5:优化了整体的文风
22
  24.05.30 v1.0:初版
23
 
24
+ ### 快速部署:
25
+ * [run_Sakura_any.zip](https://huggingface.co/SakuraLLM/Sakura-GalTransl-7B-v3/blob/main/run_Sakura_any.zip)是同时支持 Win/Mac/Linux,N卡/A卡/Apple芯片的简化部署包
26
+
27
+ 1. 解压后将模型丢进llm2run文件夹里
28
+ 2. Win:双击run_Sakura_win.bat然后选择模型
29
+ Mac:先去 app store 安装 xcode,然后打开终端切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
30
+ Linux: Linux使用GPU需要安装CUDA SDK或HIP SDK,然后切换到run_Sakura.exe所在目录,运行`chmod +x run_Sakura.exe llamafile.exe & ./run_Sakura.exe`
31
+ 4. 6G 显存 1 线程,8G 及以上显存可以设置 4-10 线程
32
+
33
+ * 其他部署方式:
34
+ GUI 部署:[Sakura_Launcher_GUI](https://github.com/PiDanShouRouZhouXD/Sakura_Launcher_GUI),在 release 里下载
35
+
36
+ * 启动失败可能是 8080 端口被占用,可以尝试[找到占用的程序](https://www.runoob.com/w3cnote/windows-finds-port-usage.html)
37
+
38
  ### 已知问题:
39
  * GPT字典**不支持一词多译写法("a/b")**,将在以后的版本尝试改善。
40
  * 需要对原文省略语素进行推理时可能出现事实错误/幻觉。
 
49
  | Q5_K | 很小的质量损失(6G/8G显存推荐) |
50
  | Q6_k | 细小的质量损失(8G及以上显存推荐) |
51
 
 
 
 
 
 
 
 
 
 
 
 
52
 
53
  ### 请求方式
54
  v2.5模型兼容sakura 0.10的prompt,推荐温度0.2;Top P 0.8;重复惩罚+0.1