ManniX's picture

ManniX PRO

ManniX-ITA

·

https://github.com/mann1x

mann1x

AI & ML interests

None yet

Recent Activity

updated a model about 9 hours ago

ManniX-ITA/gemma-4-A4B-98e-v3-it

posted an update about 13 hours ago

🚀 Two releases this week pushing merge methodology forward. ▶ Qwen3.6-27B-Omnimerge-v4-MLP https://huggingface.co/ManniX-ITA/Qwen3.6-27B-Omnimerge-v4 Same-base DARE-TIES merge of Qwen3.6-27B + 3 fine-tunes (rico03 Claude distill, Esper3.1, kai-os Opus reasoning anchor) via my Omnimerge_v2 method (OBIM-lite + DAREx-q + EMR election). Hit a Qwen3.6-specific fragility: hyperparams that work flawlessly on 3.5 produced 80% unclosed-<think> on 3.6, collapsing pass@1 to ~20%. Per-tensor delta forensics localized the failure to mlp.{gate,up,down}_proj in layers 27–52. Fix: MLP-passthrough surgery — copy MLPs verbatim from base, keep merged attn + linear_attn. Leak → 0%. Q6_K results (vs Qwen3.6 base / vs Omnimerge-v2 on Qwen3.5): • HumanEval: 84.76% (= base, +5.49 pp vs v2) • MBPP corrected: 73.40% (+15.80 pp vs base, ≈ v2) • GPQA Diamond: ~84.75% partial 192/198 (+15.5 pp vs v2) ▶ Qwen3.5-4B Importance-Signal Study (M1..M5) Controlled 5-way comparison: same Qwen3.5-4B base, same 2 fine-tunes (Jackrong Claude-4.5 distill + Crow Opus-4.6 distill), only the importance signal driving DARE-TIES sparsification varies. Q6_K HE / MBPP pass@1: • M1 Vanilla DARE-TIES → 51.22 / 47.00 • M2 OMv2 (no signal) → 52.44 / 49.40 • M3 OMv2 + Fisher → 57.93 🥇 / 48.80 • M4 mergekit ex-LRP (PR #682) → 51.22 / 49.40 • M5 OMv2 + LRP → 53.05 / 51.40 🥇 Findings: Fisher wins HE (+4.88 pp over vanilla), LRP wins MBPP (+2.60 pp). Both signals + Omnimerge_v2 recipe beat vanilla. To make multimodal-LM ex-LRP work end-to-end against Qwen3_5ForConditionalGeneration, I filed 5 patches against arcee-ai/mergekit PR #682 + 1 against rachtibat/lxt. All five Mx checkpoints + Fisher/LRP signal safetensors + reproducer scripts published.

updated a model about 16 hours ago

ManniX-ITA/Qwen3.5-4B-M5-OMv2-LRP

View all activity

Organizations

None yet

ManniX-ITA 's models 26

ManniX-ITA/gemma-4-A4B-98e-v3-it

20B • Updated about 9 hours ago • 43 • 3

ManniX-ITA/Qwen3.5-4B-M5-OMv2-LRP

Text Generation • 5B • Updated about 16 hours ago • 284

ManniX-ITA/Qwen3.5-4B-M4-ex-LRP

Text Generation • 5B • Updated about 16 hours ago • 308

ManniX-ITA/Qwen3.5-4B-M3-Fisher

Text Generation • 5B • Updated about 16 hours ago • 467

ManniX-ITA/Qwen3.5-4B-M2-OMv2

Text Generation • 5B • Updated about 16 hours ago • 368

ManniX-ITA/Qwen3.5-4B-M1-Dare-Ties

Text Generation • 5B • Updated about 16 hours ago • 372

ManniX-ITA/Qwen3.6-27B-Omnimerge-v4-GGUF

Image-Text-to-Text • 27B • Updated about 20 hours ago • 2.23k • 5

ManniX-ITA/Qwen3.6-27B-Omnimerge-v4

Image-Text-to-Text • 28B • Updated 1 day ago • 91 • 1

ManniX-ITA/gemma-4-A4B-98e-v3-it-GGUF

20B • Updated 13 days ago • 14.3k • 4

ManniX-ITA/gemma-4-A4B-109e-v3-it-GGUF

22B • Updated 13 days ago • 19k • 1

ManniX-ITA/Qwen3.5-27B-Omnimerge-v2-GGUF

27B • Updated 18 days ago • 927

ManniX-ITA/Qwen3.5-27B-Omnimerge-v2

28B • Updated 18 days ago • 102 • 1

ManniX-ITA/Qwen3.5-27B-Omnimerge-GGUF

27B • Updated 18 days ago • 3.87k

ManniX-ITA/Qwen3.5-27B-Omnimerge

28B • Updated 19 days ago • 80

ManniX-ITA/gemma-4-A4B-109e-v3-it

22B • Updated 20 days ago • 34 • 1

ManniX-ITA/gemma-4-A4B-109e-it

22B • Updated 26 days ago • 84 • 1

ManniX-ITA/gemma-4-A4B-109e-it-GGUF

22B • Updated 26 days ago • 10.4k • 4

ManniX-ITA/llama3.1-8b-stormh3

Text Generation • 8B • Updated Aug 21, 2024 • 2

ManniX-ITA/llama3.1-8b-h3storm

Text Generation • 8B • Updated Aug 21, 2024 • 4

ManniX-ITA/Llama-3-8b-64k-PoSE-GGUF

Updated Apr 26, 2024 • 58

ManniX-ITA/dolphin-2.9-llama3-8b-dus-GGUF

10B • Updated Apr 22, 2024 • 26

ManniX-ITA/dolphin-2.9-llama3-8b-dus

Text Generation • 10B • Updated Apr 22, 2024 • 5

ManniX-ITA/testMoE

Text Generation • 24B • Updated Apr 14, 2024 • 4

ManniX-ITA/Starling-LM-7B-beta-LaserRMT-v1-GGUF

Updated Apr 12, 2024 • 18 • 2

ManniX-ITA/Starling-LM-7B-beta-LaserRMT-v1

Text Generation • 7B • Updated Apr 12, 2024 • 5 • 2

ManniX-ITA/Mixtral_7Bx2_MoE-GGUF

Text Generation • 13B • Updated Apr 3, 2024 • 404 • 3