Search for a command to run...
ThinkTwice: Gemeinsame Optimierung von Large Language Models für Reasoning und Self-Refinement