1 contributor

History: 1 commit

henrycastillo

add everything but lm eval harness

c3b20da verified 5 months ago

010425_SoftCap
add everything but lm eval harness 5 months ago
011325_Fp8LmHead
add everything but lm eval harness 5 months ago
011625_Sub3Min
add everything but lm eval harness 5 months ago
011825_GPT2Medium
add everything but lm eval harness 5 months ago
012625_BatchSize
add everything but lm eval harness 5 months ago
020125_RuleTweak
add everything but lm eval harness 5 months ago
020825_GPT2MediumWeightDecay
add everything but lm eval harness 5 months ago
021425_GPT2MediumOptCoeffs
add everything but lm eval harness 5 months ago
030625_GPT2MediumLongerCooldown
add everything but lm eval harness 5 months ago
032525_GPT2MediumArchOptTweaks
add everything but lm eval harness 5 months ago
041625_GPT2Medium_Record7
add everything but lm eval harness 5 months ago
042225_GPT2Medium_Record8
add everything but lm eval harness 5 months ago
052425_FasterReduce
add everything but lm eval harness 5 months ago
052425_StableTorch
add everything but lm eval harness 5 months ago
052525_EvenFasterReduce
add everything but lm eval harness 5 months ago
052525_MuonWithAuxAdamExample
add everything but lm eval harness 5 months ago
053025_noallreduce
add everything but lm eval harness 5 months ago
060624_AdamW
add everything but lm eval harness 5 months ago
061525_GPT2MediumOptimizationLeaderboard
add everything but lm eval harness 5 months ago
071225_BosAlign
add everything but lm eval harness 5 months ago
071325_UpgradeTorch190
add everything but lm eval harness 5 months ago
100924_SOAP
add everything but lm eval harness 5 months ago
101024_Muon
add everything but lm eval harness 5 months ago
101324_llmc
add everything but lm eval harness 5 months ago
101424_ModernArch
add everything but lm eval harness 5 months ago
101724_DistributedMuon
add everything but lm eval harness 5 months ago
101824_PyTorch25
add everything but lm eval harness 5 months ago
102024_ScaleUp1B
add everything but lm eval harness 5 months ago
102924_Optimizers
add everything but lm eval harness 5 months ago
110324_UntieEmbed
add everything but lm eval harness 5 months ago
110424_50Bruns
add everything but lm eval harness 5 months ago
110624_ShortcutsTweaks
add everything but lm eval harness 5 months ago
110824_CastBf16
add everything but lm eval harness 5 months ago
110924_Replicateleloykun
add everything but lm eval harness 5 months ago
111024_ScaleShortcuts
add everything but lm eval harness 5 months ago
111024_UNetDoubleLr
add everything but lm eval harness 5 months ago
111424_QuantizedFP4
add everything but lm eval harness 5 months ago
111924_FlexAttention
add everything but lm eval harness 5 months ago
112424_WindowWarmup
add everything but lm eval harness 5 months ago
120424_ValueEmbed
add everything but lm eval harness 5 months ago
120824_UNetValueEmbedsTweaks
add everything but lm eval harness 5 months ago
121024_MFUTweaks
add everything but lm eval harness 5 months ago
121724_SparsifyEmbeds
add everything but lm eval harness 5 months ago
123124_Target350M
add everything but lm eval harness 5 months ago