Search for a command to run...
LifeSciBench: Evaluierung von Language Models für realistische, experten-niveau Aufgabensets in den Life Sciences