RedHatAI
/

Qwen3-235B-A22B-Instruct-2507-NVFP4

Text Generation

8-bit precision

compressed-tensors

Model card Files Files and versions

Qwen3-235B-A22B-Instruct-2507-NVFP4

File size: 175 Bytes

default_stage:
  default_modifiers:
    QuantizationModifier:
      targets: [Linear]
      ignore: ['re:.*lm_head.*', 're:.*mlp.gate$', 're:.*self_attn']
      scheme: NVFP4