🤗Transformers

Topic	Replies	Views	Activity
Fine tuning for social media trends 🤗Transformers	1	34	June 5, 2026
A note on interpreting internal dynamics: Stability vs. Semantic Correctness in Transformers 🤗Transformers	0	23	June 2, 2026
How can LLMs be fine-tuned for specialized domain knowledge? 🤗Transformers	3	1447	May 29, 2026
Need generative model, high-quality description generation 🤗Transformers	3	76	May 28, 2026
SFTTrainerflags blocks assistant_only_loss=True 🤗Transformers	3	61	May 26, 2026
Date format for tine-tuning AI models 🤗Transformers	5	83	May 22, 2026
Chatbot Start Prompt for GPT-J 🤗Transformers	5	1393	May 21, 2026
Automatic -100 masking of the questions in Labels 🤗Transformers	1	24	May 21, 2026
PTQ INT8 via TFLiteConverter — encoder-decoder seq2seq model loses encoder context entirely after conversion 🤗Transformers	3	95	May 16, 2026
Fucking hugging face changed the zerogpu 🤗Transformers	0	28	May 14, 2026
Train a fully open SmolLM4-750M model 🤗Transformers	0	116	May 11, 2026
The BPE pre-tokenizer was not recognized! 🤗Transformers	6	219	May 7, 2026
Custom batches in sentence-transformers for MultipleNegativesRankingLoss 🤗Transformers	4	91	May 1, 2026
I developed an experimental Graph-Native Artificial Brain engine 🤗Transformers	4	75	May 1, 2026
When i use tool its pause and restart space not working why DeepSpeed	0	18	April 30, 2026
CPU offloading error scenario 🤗Transformers	11	282	April 27, 2026
Gemma 3 12B: 4-bit Quantization failing/ignored in Transformers v5.1.0 (Gemma3ForConditionalGeneration) 🤗Transformers	11	396	April 24, 2026
Why am I facing this Error while running this code 🤗Transformers	1	75	April 23, 2026
What are the best tutorials to learn Transformers step by step? 🤗Transformers	2	133	April 20, 2026
LLM Course code errors 🤗Transformers	8	304	April 17, 2026
Independent researcher looking for technical feedback on a paper about a revision-capable language model 🤗Transformers	0	39	April 17, 2026
Why this BERTScore has a high precision? 🤗Transformers	1	77	April 16, 2026
Fine-tuning Gemma-4-E2B on MacBook M3 🤗Transformers	4	807	April 14, 2026
Current State and Future of "Integer-Only" LLM Inference (Non-Floating Point) 🤗Transformers	1	190	April 14, 2026
Continous increase in Memory usage 🤗Transformers	17	2317	April 14, 2026
Peft 0.18.1 crashing when fine-tuning - Part 2 🤗Transformers	2	42	April 14, 2026
Peft 0.18.1 crashing when fine-tuning 🤗Transformers	4	196	April 13, 2026
[Guide] How I debugged T5 fine-tuning for a medical diagnosis task 🤗Transformers	1	48	April 11, 2026
Runtime Layer on modeling_utils.py (No Source Changes) 🤗Transformers	0	72	April 11, 2026
What happened to DeepSite 2.0 🤗Transformers	3	61	April 9, 2026