Search for a command to run...
Anfachen kreativen Schreibens in kleinen Sprachmodellen: LLM-as-a-Judge im Vergleich zu mehragentenbasierten verfeinerten Belohnungen